Автор работы: Пользователь скрыл имя, 21 Января 2011 в 22:43, курсовая работа
Объектом исследования выбрана совокупность трёхкомнатных квартир Металлургического района на вторичном рынке г. Челябинска.
В качестве предмета исследования выступает оценка продажной цены квартиры.
Целью работы является исследование зависимости цены предложения трехкомнатных квартир на вторичном рынке Металлургического р-на г.Челябинска в 2005 году от характеристик этих квартир.
Основным методом исследования является регрессионный анализ.
Введение……………………………………………………. 3
1 Описание предметной области …………………………... 4
2 Постановка задачи ………………………………………... 9
3 Моделирование …………………………………………… 11
4 Идентификация и интерпретация полученных моделей 19
5 Верификация ……………………………………………… 27
6 Интерпретация окончательной модели………………… 31
Заключение ……………………………………………… 38
Список использованной литературы …………………… 39
Значимые регрессоры выделены жирным шрифтом.
Все значимые факторы имеют положительные коэффициенты, что говорит об их прямом влиянии на цену кватиры.
Значимыми являются следующие факторы (в скобках указано, на сколько % изменится цена при наличии данного фактора - для качественных факторов и при увеличении данного фактора на единицу – для количественных факторов):
Х2 – удобство положения дома (0.09 %);
Х5 – величина жилой площади (0.004 %);
Х6 – величина остальной площади (0.01 %);
Х9 – наличие ремонта (0.06);
Х13 – полнометражная серия квартиры (0.12 %);
Х15 – элитная серия квартиры (0.64 %);
Х16 – количество балконов (0.08 %).
Факторы, незначимые в данной модели 2.1, одинаковы с незначимыми факторами модели 1.1. Поэтому объяснение возможных причин их незначимости также аналогичны. Они подробно изложены в разделе 3.1.
Незначимые
регрессоры удаляются постепенно, т.к.
в связи с возможным наличием
мультиколлинеарности некоторые из них
могут оказаться значимыми при освобождении
от влияния действительно незначимых
факторов. Т.о. строится модель 2.2.
Таблица 3.4 Результаты оценки параметров модели 2.2.
Переменная | Оценка коэффициента | Стандартная ошибка | t-статистика | Значимость. |
C | 6.317361 | 0.085884 | 73.55731 | 0.0000 |
X2 | 0.095826 | 0.028153 | 3.403759 | 0.0009 |
X5 | 0.004071 | 0.001406 | 2.895085 | 0.0046 |
X6 | 0.011205 | 0.002386 | 4.695705 | 0.0000 |
X8 | -0.081884 | 0.032867 | -2.491425 | 0.0142 |
X9 | 0.068900 | 0.025067 | 2.748593 | 0.0070 |
X10 | -0.086980 | 0.038743 | -2.245044 | 0.0267 |
X13 | 0.105313 | 0.034662 | 3.038298 | 0.0030 |
X15 | 0.604334 | 0.105167 | 5.746419 | 0.0000 |
X16 | 0.064983 | 0.022982 | 2.827600 | 0.0056 |
R-squared | 0.781369 | F-statistic | 44.07838 | |
Adjusted R-squared | 0.763642 | Prob(F-statistic) | 0.000000 | |
S.E. of regression | 0.126703 |
.
Коэффициент детерминации получился равным R-squared=0.78, т.е. весьма близким к единице, что говорит о возможной близости построенного уравнения к выборке.
Скорректированный коэффициент детерминации имеет значение
Adjusted R-squared=0.76, что также может говорить о корректности предыдущего утверждения.
Значение Prob(F-statistic)=0, следовательно, уравнение в целом абсолютно значимо.
Коэффициенты
при всех учтенных в данной модели
факторах значимы.
3.3 Логарифмическая модель.
Начальная логарифмическая модель содержит все 20 имеющихся регрессоров.
Таблица 3.5 Результаты оценки параметров модели 3.1
Переменная | Оценка коэффициента | Стандартная ошибка | t-статистика | Значимость |
C | 4.847865 | 0.389788 | 12.43718 | 0.0000 |
X1 | 0.015663 | 0.025634 | 0.611031 | 0.5426 |
X2 | 0.086424 | 0.031062 | 2.782327 | 0.0064 |
X3 | 0.003834 | 0.006897 | 0.555905 | 0.5795 |
X4 | -0.007077 | 0.006480 | -1.092045 | 0.2774 |
LOG(X5) | 0.306323 | 0.094082 | 3.255897 | 0.0015 |
LOG(X6) | 0.200381 | 0.057299 | 3.497102 | 0.0007 |
X7 | 0.051537 | 0.038889 | 1.325231 | 0.1881 |
X8 | -0.061612 | 0.046783 | -1.316969 | 0.1908 |
X9 | 0.055911 | 0.026800 | 2.086216 | 0.0395 |
X10 | -0.051750 | 0.060443 | -0.856189 | 0.3939 |
X11 | 0.006466 | 0.065561 | 0.098625 | 0.9216 |
X12 | 0.045126 | 0.063545 | 0.710142 | 0.4793 |
X13 | 0.116861 | 0.056525 | 2.067409 | 0.0413 |
X14 | 0.026579 | 0.089764 | 0.296102 | 0.7678 |
X15 | 0.688828 | 0.118121 | 5.831518 | 0.0000 |
X16 | 0.075464 | 0.034624 | 2.179534 | 0.0316 |
X17 | -0.026059 | 0.038408 | -0.678491 | 0.4990 |
X18 | 0.040163 | 0.036071 | 1.113425 | 0.2682 |
X19 | 0.003094 | 0.032094 | 0.096403 | 0.9234 |
R-squared | 0.798015 | F-statistic | 21.00196 | |
Adjusted R-squared | 0.760018 | Prob(F-statistic) | 0.000000 | |
S.E. of regression | 0.127671 |
Значимые регрессоры выделены жирным шрифтом.
Незначимыми оказались те же, факторы, что и в модели 1.1. В разделе 3.1 приводится обоснование возможных причин их незначимости.
Постепенно удаляя из модели незначимые факторы, переходим к скорректированной полулогарифмической модели 3.2.
Таблица
3.6 Результаты оценки
параметров модели 3.2.
Переменная | Оценка коэффициента | Стандартная ошибка | t-статистика | Значимость |
C | 4.344850 | 0.391207 | 11.10627 | 0.0000 |
X2 | 0.091543 | 0.026524 | 3.451323 | 0.0008 |
LOG(X3/X4) | 0.044884 | 0.018737 | 2.395527 | 0.0183 |
LOG(X5+X6) | 0.532116 | 0.096268 | 5.527467 | 0.0000 |
X9 | 0.064231 | 0.025013 | 2.567882 | 0.0115 |
X12 | 0.104642 | 0.034641 | 3.020798 | 0.0031 |
X13 | 0.140065 | 0.032859 | 4.262618 | 0.0000 |
X15 | 0.727334 | 0.102035 | 7.128315 | 0.0000 |
X16 | 0.082189 | 0.023461 | 3.503266 | 0.0007 |
R-squared | 0.778594 | F-statistic | 49.23217 | |
Adjusted R-squared | 0.762779 | Prob(F-statistic) | 0.000000 | |
S.E. of regression | 0.126934 |
.
Коэффициент детерминации получился равным R-squared=0.78, т.е. весьма близким к единице, что, возможно, говорить о близости построенного уравнения к выборке. Скорректированный коэффициент детерминации имеет значение Adjusted R-squared=0.76, что также может говорить о корректности предыдущего утверждения.
Значение
Prob(F-statistic)=0, следовательно, уравнение
в целом абсолютно значимо. Коэффициенты
при всех учтенных в данной модели факторах
значимы.
Т.о.
на этапе моделирования построено
3 различные значимые модели (линейная,
полулогарифмическая, логарифмическая),
оценивающие зависимость цены предложения
трёхкомнатной квартиры на рынке вторичного
жилья Металлургического района от различных
факторов.
4. Идентификация и интерпретация полученных моделей.
На
этапе идентификации модели проводится
её тестирование и коррекция на гетероскедастичность,
после чего каждая из трёх полученных
моделей интерпретируется.
4.1 Суть гетероскедастичности.
Для нахождения оценок линейных регрессионных зависимостей применяется метод наименьших квадратов (МНК).
Однако, МНК требует выполнения условий Гаусса-Маркова, которые гарантируют состоятельность, несмещенность и эффективность найденных оценок [1, с.23]. Нарушение этих условий может давать оценки с плохими статистическими свойствами. Одной из ключевых предпосылок МНК является условие постоянства дисперсии случайных отклонений. Выполнимость данной предпосылки называется гомоскедастичностью (постоянством дисперсии отклонений). Её невыполнимость называется гетероскедастичностью (непостоянством дисперсии отклонений) [3, с.230].
Т.о.
при гетероскедастичности оценки коэффициентов
получаются неэффективными. Вследствие
вышесказанного все выводы, получаемые
на основе соответствующих t- и F-статистик,
будут ненадежными. Следовательно, статистические
выводы, получаемые при стандартных проверках
качества оценок, могут быть ошибочными
приводить к неверным заключениям по построенной
модели. Вполне вероятно, что стандартные
ошибки коэффициентов будут занижены.
Это может привести к признанию статистически
значимыми коэффициентов, таковыми на
самом деле не являющимися [3, с.232].
4.2 Проверка и коррекция на гетероскедастичность.
Проверка на гетероскедастичность построенных моделей осуществляется в пакете EViews-3 с помощью теста Уайта. В нашем случае его результаты говорят о том, что гипотеза о гомоскедастичности не подтвердилась для любой из трёх моделей.
Проведем коррекцию на гетероскедастичность для каждой из них.
Сделать
поправку на гетероскедастичность и
«улучшить» оценку матрицы ковариаций
позволяет метод расчета стандартных
ошибок по форме Уайта, автоматически
реализуемый в EViews-3. Результаты коррекции
линейной, полулогарифмической и логарифмической
моделей на гетероскедастичность приведены
ниже.
4.2.1.
Коррекция на гетероскедастичность
модели 1.2.
Таблица 4.1 Скорректированная на гетероскедастичность модель 1.2.
Переменная | Оценка коэффициента | Стандартная ошибка | t-статистика | Значимость |
C | 365.4062 | 179.1846 | 2.039272 | 0.0438 |
X2 | 99.52499 | 30.38976 | 3.274951 | 0.0014 |
X3/X4 | 24.29101 | 10.83755 | 2.241376 | 0.0270 |
X5+X6 | 3.910585 | 3.634448 | 1.075978 | 0.2842 |
X12 | 106.7004 | 38.78448 | 2.751111 | 0.0069 |
X13 | 203.1785 | 58.28511 | 3.485943 | 0.0007 |
X15 | 1669.803 | 355.8772 | 4.692077 | 0.0000 |
X16 | 133.6699 | 50.29383 | 2.657779 | 0.0090 |
R-squared | 0.795548 | F-statistic | 62.81391 | |
Adjusted R-squared | 0.782883 | Prob(F-statistic) | 0.000000 | |
S.E. of regression | 175.1235 |