Автор работы: Пользователь скрыл имя, 21 Января 2011 в 22:43, курсовая работа
Объектом исследования выбрана совокупность трёхкомнатных квартир Металлургического района на вторичном рынке г. Челябинска.
В качестве предмета исследования выступает оценка продажной цены квартиры.
Целью работы является исследование зависимости цены предложения трехкомнатных квартир на вторичном рынке Металлургического р-на г.Челябинска в 2005 году от характеристик этих квартир.
Основным методом исследования является регрессионный анализ.
Введение……………………………………………………. 3
1 Описание предметной области …………………………... 4
2 Постановка задачи ………………………………………... 9
3 Моделирование …………………………………………… 11
4 Идентификация и интерпретация полученных моделей 19
5 Верификация ……………………………………………… 27
6 Интерпретация окончательной модели………………… 31
Заключение ……………………………………………… 38
Список использованной литературы …………………… 39
4. Наличие телефона.
Т.к.
Металлургический район практически
полностью телефонизирован, то телефоны
установлены в абсолютном большинстве
квартир. Они могут отсутствовать
в домах на окраинах, что учитывает
уже имеющийся фактор «удобство
положения», или в новостройках.
В результате описания предметной области и анализа объявлений о продаже квартир выявлено 19 факторов, от которых, предположительно, зависит продажная цена квартиры. Они включаются в модель, т.к. наиболее полно раскрывают характеристики квартиры.
Также
в разделе выдвинут ряд предположений
о возможной незначимости некоторых
факторов и обоснованы причины этого
явления. Эти гипотезы предстоит
проверить на дальнейших этапах работы.
2. Постановка задачи
В данной курсовой работе рассматривается задача построения аналитической формулы средней стоимости квартиры в зависимости от факторов, влияющих на эту стоимость.
Зависимая переменная: Y - оценка продажной цены квартиры (в тыс.руб).
Независимые переменные: факторы, от которых, предположительно, зависит цена предложения квартиры.
Они разделяются на 2 типа:
1.
количественные – имеют
2. качественные (фиктивные) – имеют значение 0, если квартира не обладает указанным в факторе качеством, и 1, если обладает.
Х 3 = этажей в
доме (штук)
Х
4 = номер этажа
Х
5 = жилая площадь (в
м2)
Х
6 = остальная площадь (в
м2)
Х 16 = количество балконов
Для описания эконометрической модели зависимости продажной цены квартиры от указанных факторов выбрана модель регрессионного уравнения, в частности, модель множественной регрессии.
В качестве параметров модели предполагается использовать весовые коэффициенты при отобранных факторах (в модели весовые коэффициенты обозначены С1,…, С19).
В работе предполагается рассмотреть три типа регрессионных моделей:
1. линейную: Y=C1+C2*X1+C3*X2+…+C20*X19
2. полулогарифмическую:
LOG(Y)=C1+C2*X1+C3*X2+…+C20*
3. логарифмическую:
LOG(Y) =C1+C2*X1+C3*X2+C6*LOG(X5)+С(
Т.о. определены набор регрессоров, включаемых в модель, и функциональные формы моделей, далее рассматриваемых в работе.
3. Моделирование.
На
этапе моделирования ставится задача
построения различных регрессионных
моделей продажной цены квартир – линейной,
полулогарифмической и логарифмической.
3.1 Линейная модель.
В
соответствии с методическими указаниями
к выполнению данной курсовой работы
за начальную модель примем модель множественной
линейной регрессии, включающей все рассматриваемые
факторы:
Таблица 3.1 Результаты оценки параметров модели 1.1.
Переменная | Оценка коэффициента | Стандартная ошибка | t-статистика | Значимость |
C | 419.8737 | 158.5591 | 2.648058 | 0.0094 |
X1 | 12.68748 | 34.39027 | 0.368926 | 0.7130 |
X2 | 98.34545 | 41.56345 | 2.366152 | 0.0199 |
X3 | 3.242920 | 9.260882 | 0.350174 | 0.7269 |
X4 | -10.61733 | 8.754530 | -1.212782 | 0.2280 |
X5 | 0.064198 | 2.063977 | 0.031104 | 0.9752 |
X6 | 12.07245 | 3.554034 | 3.396829 | 0.0010 |
X7 | 48.09135 | 52.27926 | 0.919893 | 0.3598 |
X8 | -67.36987 | 63.05200 | -1.068481 | 0.2879 |
X9 | 62.60421 | 36.02753 | 1.737677 | 0.0853 |
X10 | -8.621625 | 80.95371 | -0.106501 | 0.9154 |
X11 | 34.52836 | 88.19550 | 0.391498 | 0.6963 |
X12 | 48.50786 | 85.80417 | 0.565332 | 0.5731 |
X13 | 162.1596 | 76.03639 | 2.132658 | 0.0354 |
X14 | -1.120639 | 120.4957 | -0.009300 | 0.9926 |
X15 | 1587.566 | 173.8360 | 9.132549 | 0.0000 |
X16 | 139.2373 | 46.16360 | 3.016171 | 0.0032 |
X17 | -44.85922 | 51.70357 | -0.867623 | 0.3877 |
X18 | 59.41530 | 48.49251 | 1.225247 | 0.2233 |
X19 | 24.11301 | 43.21481 | 0.557980 | 0.5781 |
R-squared | 0.823775 | F-statistic | 24.84905 | |
Adjusted R-squared | 0.790624 | Prob(F-statistic) | 0.000000 | |
S.E. of regression | 171.9732 |
В скобках под оценками коэффициентов модели приведены их стандартные ошибки.
Выделены те параметры модели, для которых гипотеза о значимости коэффициентов подтвердилась на 5% уровне значимости, т.е. значение Prob.< 0,05 и значения стандартной ошибки меньше оцениваемых коэффициентов в 2 раза и более.
Значимыми оказались факторы:
1.
Х2 - удобство положения
2.
Х6 - остальная площадь (общая
3. Х13 - полнометражная серия квартиры увеличивает цену на 162.16 тыс. руб.;
4.
Х15 - элитная серия квартиры
5. Х16 - наличие каждого балкона увеличивает цену на 139.24 тыс. руб.
Коэффициент детерминации получился равным R-squared=0.82, т.е. весьма близким к единице. Исходя из этого, можно сделать предположение о близости построенного уравнения к выборке.
Значение Prob(F-statistic)=0, следовательно, уравнение в целом абсолютно значимо.
Для
выявления эффекта
Значение коэффициента парной корреляции между факторами X5 и X6 равно 0.41, что может повлечь эффект мультиколлинеарности.
Исходя из экономического смысла, можно объединить эти факторы, просуммировав их (т.к. Х5 - жилая площадь, Х6 – остальная площадь).
Коэффициент парной корреляции между X3 (количество этажей в доме) и X4 (№ этажа) равен 0.48, а между Х3 и X8 (материал стен дома) его значение равно 0.7, что также может обусловить появление мультиколлинеарности.
В связи с этим, введем вместо Х3 и Х4 регрессор (Х3/Х4), которую можно интерпретировать как «соотношение этажности дома и этажа квартиры».
На основании больших значений коэффициентов парной корреляции со многими регрессорами (см. приложение 2), больших стандартных ошибок и больших значений Prob. (> 0.05) исключаем незначимые регрессоры.
Можно предположить, что приведенные ниже факторы незначимы по следующим причинам:
1. Х1 – наличие посредника.
Незначим в связи с невозможностью достоверного определения участия посредника в продаже квартиры.
2. Х7 – наличие телефона;
Х17 – застекленный балкон;
Х18 – железная дверь;
Х19 – домофон.
Незначимость данных факторов подтверждает предположения, выдвинутые в п. 1.2.3 данной работы.
3. Х8 – материал стен дома.
Фактор незначим, так как коррелирует с этажностью дома (пяти-, четырёх- и трёхэтажные дома чаще всего строят из кирпича, а высотные дома – панельные).
4. Х10 – серия: хрущевка;
Х11 – брежневка.
Можно предположить, что факторы незначимы из-за возможной корреляции с величиной площади квартиры. К тому же указанные серии чаще всего имеют старые дома и существенных особенностей, способных сильно влиять на продажную цену квартиры, эти проекты не имеют.
5. Х14 – серия: ленинградский проект.
Фактор незначим, т.к. в выборки присутствует всего несколько квартир, обладающих этим признаком. К тому же, серия не обладает ярко выраженными особенностями, способными существенно повлиять на цену квартиры.
Незначимые факторы из модели удаляются постепенно, т.к. исключив все их одновременно, мы рискуем потерять на самом деле значимые регрессоры, освобожденные от влияния незначимых.
Исходя
из внесенных изменений в
Таблица
3.2 Результаты оценки
параметров модели 1.2.
Переменная | Оценка коэффициента | Стандартная ошибка | t-статистика | Значимость |
C | 365.4062 | 106.4114 | 3.433899 | 0.0008 |
X2 | 99.52499 | 36.27196 | 2.743855 | 0.0071 |
X3/X4 | 24.29101 | 7.967346 | 3.048821 | 0.0029 |
X5+X6 | 3.910585 | 1.647258 | 2.373996 | 0.0193 |
X12 | 106.7004 | 47.07295 | 2.266704 | 0.0253 |
X13 | 203.1785 | 43.60360 | 4.659674 | 0.0000 |
X15 | 1669.803 | 153.7551 | 10.86015 | 0.0000 |
X16 | 133.6699 | 31.21175 | 4.282679 | 0.0000 |
R-squared | 0.795548 | F-statistic | 62.81391 | |
Adjusted R-squared | 0.782883 | Prob(F-statistic) | 0.000000 | |
S.E. of regression | 175.1235 |
Значимыми оказались все факторы, включенные в регрессию.
Значение коэффициента детерминации получилось равным R-squared=0.80, т.е. близким к единице. Т.о. можно выдвинуть предположение о близости построенного уравнения к выборке.
Скорректированный коэффициент детерминации имеет значение
Adjusted R-squared=0.78, что также указывает на возможность предыдущего утверждения.
Коэффициента
детерминации полученной модели меньше,
чем у исходного уравнения, где
R-squared=0.82. Но разница между
Значение
Prob(F-statistic)=0, следовательно, уравнение
в целом абсолютно значимо.
3.2 Полулогарифмическая модель..
Начальная полулогарифмическая модель включает в себя все рассматриваемые регрессоры.
Таблица 3.3 Результаты оценки параметров модели 2.1.
Переменная | Оценка коэффициента | Стандартная ошибка | t-статистика | Значимость. | |||
C | 6.215708 | 0.118793 | 52.32372 | 0.0000 | |||
X1 | 0.010182 | 0.025765 | 0.395181 | 0.6935 | |||
X2 | 0.094076 | 0.031140 | 3.021118 | 0.0032 | |||
X3 | 0.004385 | 0.006938 | 0.631958 | 0.5288 | |||
X4 | -0.006357 | 0.006559 | -0.969170 | 0.3348 | |||
X5 | 0.003870 | 0.001546 | 2.502599 | 0.0139 | |||
X6 | 0.010451 | 0.002663 | 3.925092 | 0.0002 | |||
X7 | 0.050428 | 0.039168 | 1.287481 | 0.2009 | |||
X8 | -0.060141 | 0.047239 | -1.273130 | 0.2059 | |||
X9 | 0.060583 | 0.026992 | 2.244477 | 0.0270 | |||
X10 | -0.057145 | 0.060651 | -0.942194 | 0.3483 | |||
X11 | 0.007218 | 0.066077 | 0.109231 | 0.9132 | |||
X12 | 0.040377 | 0.064285 | 0.628093 | 0.5314 | |||
X13 | 0.121036 | 0.056967 | 2.124673 | 0.0361 | |||
X14 | 0.013078 | 0.090276 | 0.144870 | 0.8851 | |||
X15 | 0.636490 | 0.130239 | 4.887095 | 0.0000 | |||
X16 | 0.080538 | 0.034586 | 2.328631 | 0.0219 | |||
X17 | -0.030098 | 0.038737 | -0.776983 | 0.4390 | |||
X18 | 0.046064 | 0.036331 | 1.267911 | 0.2077 | |||
X19 | 0.006912 | 0.032377 | 0.213486 | 0.8314 | |||
R-squared | 0.794288 | F-statistic | 20.52511 | ||||
Adjusted R-squared | 0.755589 | Prob(F-statistic) | 0.000000 | ||||
S.E. of regression | 0.128843 |