Моделирование продажной стоимости двухкамерного холодильника

Автор работы: Пользователь скрыл имя, 26 Августа 2011 в 10:09, курсовая работа

Описание работы

Современный быт сложно представить без холодильного оборудования. Ранее выбор холодильника был достаточно простой задачей, что обуславливалось незначительным разнообразием производителей и предлагаемых ими моделей. Сегодня же ситуация кардинально изменилась - количество брендов, предлагающих покупателям свою продукцию насчитывает более 20, а число выпускаемых ими моделей - почти две сотни. Именно поэтому определиться с выбором достаточно непросто.

Содержание работы

Введение…………………………………………………………………………..3

1.Постановка задачи………………………………………………………………..4
2.Анализ предметной области……………………………………………………..5
3.Моделирование…………………………………………………………………..10
4.Описание информационной базы………………………………………………15
5.Идентификация модели…………………………………………………………18
1.Идентификация линейной модели……………………………………....19
2.Идентификация полулогарифмической модели……………………….22
3.Идентификация логарифмической модели……………………………..24
4.Выбор наилучшей модели……………………………………………….26
6.Проверка качества модели………………………………………………………29
1.Значимость коэффициентов регрессии…………………………………29
2.Значимость модели в целом……………………………………………..30
3.Соответствие модели выборочным данным……………………………30
7.Интерпретация модели…………………………………………………………..32
Заключение……………………………………………………………………….34

Список использованных источников…………………………………………...35

Приложение………………………………………………………………………36

Файлы: 1 файл

Моделирование_.doc

— 1.14 Мб (Скачать файл)
 
  1. Цена двухкамерных холодильников в городе Челябинске варьируется от 15050 тыс. руб. до 38200 тыс. руб. Средняя цена – 23776.68 тыс. руб (Приложение 2, Рис.1).
  2. Проведя анализ продаваемых холодильников, мы выяснили, что 17% - Indesit, 32% - Bosch, 22% - Whirlpool (Приложение 2, Рис.2,3,4).
  3. Из Приложения 2, Рис.5,6 видно, что 44% - белый цвет холодильника, а 50% - серебристый цвет холодильника.
  4. Из Приложения 2, Рис.8,9 видно, что цена холодильника зависит от класса энергопотребления, где класс А составляет 64%, а класс В – 17%.
  5. Минимальное количество компрессоров  - 1, максимальное -2, среднее значение – 1.225 (Приложение 2, Рис.10).
  6. Объем морозильной камеры варьируется от 17 до 140 л, среднее значение – 86,57 л (Приложение 2, Рис.16); объем холодильной камеры от 157 до 400 л, среднее значение – 236,66 л (Приложение 2, Рис. 17).
  7. Ширина варьирует от 54 до 81, среднее значение – 60,24 (Приложение 2, Рис.18); глубина от 54,2 до 78, среднее – 63,96 (Приложение 2, Рис. 19); высота от 122 до 204, среднее – 186,11 (Приложение 2, Рис. 20).
  8. Также выяснилось, что у 58% продаваемых холодильников электронное управление (Приложение 2, Рис.7); у 84% - морозильная камера расположена снизу (Приложение 2, Рис.11); у 74% - присутствует суперзаморозка морозильной камеры (Приложение 2, Рис. 12); у 27% - присутствует суперохлождение холодильной камеры (Приложение 2, Рис. 13); у 48% морозильной камеры и у 41% холодильной камеры  используется система размораживания No Forst (Приложение 2, Рис. 14,15).

     Полученные  показатели говорят об однородности исходной статистической  информации. Используя графические возможности программного пакета Eviews, были построены гистограммы (Приложение 2), анализ которых также подтверждает общую однородность зарегистрированных данных.

     Для последующей оценки качества выбранной  модели из множества данных выделим часть (20%) для проверки близости реальных данных расчетным, полученным по другой части данных. Таким образом, рабочая выборка составит  128 наблюдений. 

 

     

5. Идентификация модели

     Целью данной курсовой работы является построение нескольких вариантов эконометрической модели зависимости стоимости двухкамерного холодильника от его характеристик. Построим линейную, полулогарифмическую и логарифмическую множественную регрессии, оценки коэффициентов которых ищутся методом наименьших квадратов.

     Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Мультиколлинеарность возникает, когда более чем два фактора связаны между собой линейной зависимостью. В результате нельзя правильно оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность, тем менее надёжна оценка распределения суммы объясненной вариации по отдельным факторам с помощью МНК [2,c.98].

     Одним из признаков мультиколлинеарности является большие стандартные ошибки и малая значимость оценок, в то время, как модель является достаточно значимой. Так же при мультиколлинеарности оценки могут иметь неправильные с экономической точки зрения знаки или неоправданно большие значения [3,c.94].

     Проверим  выборку на наличие мультиколлинеарности. Для этого рассмотрим корреляционную матрицу (Приложение 3).

     Если  коэффициент корреляции принадлежит  отрезку (0,65; 1,00), то соответствующая  связь относится к сильной [1, с.53].

     Из  таблицы видно, что между Colour_Write и регрессором Colour_Silvery, также между Class_B и Indesit и между Width и Depth  имеется сильная корреляция. Во избежание эффекта мультиколлинеарности необходимо исключить из регрессии сильно зависимые переменные. Так как эти регрессоры  между собой имеет явную зависимость, то при исключение Colour_Silvery, Class_B и Width  из дальнейшего анализа не приведет к ухудшению регрессий.

     Проверку  выполняемости условия Гаусса-Маркова  о постоянстве дисперсии ошибок регрессии будем проводить с  помощью теста на  гетероскедастичность – теста Уайта. В случае нарушения базовой предпосылки использования методов наименьших квадратов будем делать поправку на гетероскедастичность.

     Для определения корректности выбора вида модели используем RESET- тест на функциональную форму модели.  

          5.1 Идентификация линейной модели

PRICE = C(1) + C(2)*COLOUR_WRITE + C(3)*ELECTRONNOE + C(4)*CLASS_A + C(5)*COMPRESSOR + C(6)*RMK_CNIZY + C(7)*SZM + C(8)*SOXL + C(9)*RAZMOR_MK + C(10)*RAZMOR_HK + C(11)*VMK + C(12)*VHK + C(13)*DEPTH + C(14)*HEIGHT + C(15)*INDESIT + C(16)*BOSCH + C(17)*WHIRLPOOL 

     Получаем  следующие оценки коэффициентов  регрессии методом наименьших квадратов:

       

     Рис. 5.1.1 Результаты оценивания объясняющих переменных и модели в целом

     При 5-ти процентном уровне значимости следующие коэффициенты оказались незначимыми: compressor, rmk_cnizy, szm, razmor_hk, vmk, depth, height, whilrlpool.

     Модель  в целом значима, доля общей вариации результирующего признака (R-squared) составила 0,6723.

     С целью исключения коррелирующих  между собой факторов рассмотрим корреляционную матрицу (Приложение 3).

     В результате последовательного исключения незначимых переменных получили следующие  результаты оценивания:

     

     Рис. 5.1.2 Результаты вычисления после исключения незначимых переменных

PRICE = 33897.91764 - 2646.788256*COLOUR_WRITE + 2287.243032*ELECTRONNOE - 2242.280271*CLASS_A + 4027.561932*SOXL + 2412.357199*RAZMOR_MK + 29.89422351*VHK - 247.4443967*DEPTH - 6629.486951*INDESIT - 2541.658419*BOSCH - 2698.042488*WHIRLPOOL 

     Модель  в целом осталась значима; доля общей вариации результирующего признака уменьшилась на 0,0095 и составила 0,6628.

     Для исследования полученной модели на наличие  гомоскедастичности используется тест Уайта:

     

           Рис. 5.1.3 Результаты теста Уайта

     На 5% уровне значимости, гипотеза о гомоскедастичности отвергается, т.е. признается наличие гетероскедастичности.

     После применения поправки были получены следующие  результаты:

     

        Рис. 5.1.4 Результаты применения поправки на гетероскедастичность

     Значения  переменных несколько изменились, но все они остались значимыми. Доля общей вариации результирующего признака не изменилась (0,6628), как и значимость модели в целом (значима).

     Проводим  RESET-тест  на ошибку спецификации регрессоров:

     

          Рис. 5.1.5  Результаты  RESET-теста

     Результат RESET-теста указывает на ошибочную спецификацию модели. 

       

          5.2 Идентификация полулогарифмической модели

LOG(PRICE) = C(1) + C(2)*COLOUR_WRITE + C(3)*ELECTRONNOE + C(4)*CLASS_A + C(5)*COMPRESSOR + C(6)*RMK_CNIZY + C(7)*SZM + C(8)*SOXL + C(9)*RAZMOR_MK + C(10)*RAZMOR_HK + C(11)*VMK + C(12)*VHK + C(13)*DEPTH + C(14)*HEIGHT + C(15)*INDESIT + C(16)*BOSCH + C(17)*WHIRLPOOL 

      Получаем  следующие оценки коэффициентов  регрессии методом наименьших квадратов:

     

     Рис. 5.2.1 Результаты оценивания объясняющих переменных и модели в целом

     При 5-ти процентном уровне значимости следующие коэффициенты оказались незначимыми: class_a, compressor, rmk_cnizy, szm, razmor_hk, vmk, depth, height.

     Модель  в целом значима, доля общей вариации результирующего признака составила 0,6847.

     С целью исключения коррелирующих  между собой факторов рассмотрим корреляционную матрицу (Приложение 3).

     В результате последовательного исключения незначимых переменных получили следующие  результаты оценивания:

     

     Рис. 5.2.2. Результаты вычисления после исключения незначимых переменных

LOG(PRICE) = 10.4865464 - 0.1132719331*COLOUR_WRITE + 0.1166536381*ELECTRONNOE - 0.0672971414*CLASS_A + 0.1474838763*SOXL + 0.1075644245*RAZMOR_MK + 0.001463502726*VHK - 0.0117092567*DEPTH - 0.2759079383*INDESIT - 0.1186543974*BOSCH - 0.122385393*WHIRLPOOL 

     Модель  в целом осталась значима; доля общей  вариации результирующего признака уменьшилась на 0,0082 и составила 0,6765.

     Для исследования полученной модели на наличие  гомоскедастичности используется тест Уайта:

     

     Рис. 5.2.3. Результаты теста Уайта

     На 5% уровне значимости, гипотеза о гомоскедастичности принимается. 
 
 

     Проводим  RESET-тест  на ошибку спецификации регрессоров:

     

     Рис. 5.2.4. Результаты  RESET-теста

     Результат RESET-теста свидетельствует об отсутствии ошибки спецификации. 

          5.3 Идентификация логарифмической модели

LOG(PRICE) = C(1) + C(2)*COLOUR_WRITE + C(3)*ELECTRONNOE + C(4)*CLASS_A + C(5)*LOG(COMPRESSOR) + C(6)*RMK_CNIZY + C(7)*SZM + C(8)*SOXL + C(9)*RAZMOR_MK + C(10)*RAZMOR_HK + C(11)*LOG(VMK) + C(12)*LOG(VHK) + C(13)*LOG(DEPTH) + C(14)*LOG(HEIGHT) + C(15)*INDESIT + C(16)*BOSCH + C(17)*WHIRLPOOL 

      Получаем  следующие оценки коэффициентов  регрессии методом наименьших квадратов:

     

     Рис. 5.3.1.  Результаты оценивания объясняющих  переменных и модели в целом

     При 5-ти процентном уровне значимости следующие коэффициенты оказались незначимыми: class_a, log(compressor), rmk_cnizy, szm, razmor_hk, log(vmk), log(depth), log(height).

     Модель  в целом значима, доля общей вариации результирующего признака составила 0,6847.

     С целью исключения коррелирующих  между собой факторов рассмотрим корреляционную матрицу (Приложение 3).

     В результате последовательного исключения незначимых переменных получили следующие  результаты оценивания:

     

     Рис. 5.3.2. Результаты вычисления после исключения незначимых переменных

LOG(PRICE) = 11.2020286 - 0.1137005911*COLOUR_WRITE + 0.1167036723*ELECTRONNOE - 0.066814893*CLASS_A + 0.1480422557*SOXL + 0.106879945*RAZMOR_MK + 0.3319897268*LOG(VHK) - 0.70497857*LOG(DEPTH) - 0.2756174193*INDESIT - 0.1192342258*BOSCH - 0.1209517658*WHIRLPOOL 

     Модель  в целом осталась значима; доля общей  вариации результирующего признака уменьшилась на 0,0073 и составила 0,6774.

     Для исследования полученной модели на наличие  гомоскедастичности используется тест Уайта:

     

     Рис. 5.3.3. Результаты теста Уайта

     На 5% уровне значимости, гипотеза о гомоскедастичности принимается.

          Проводим RESET-тест  на ошибку спецификации регрессоров:

     

     Рис. 5.3.4. Результаты  RESET-теста

     Результат RESET-теста свидетельствует об отсутствии ошибки спецификации. 

         5.4 Выбор наилучшей модели

     В процессе моделирования получено две  значимых модели, качественно описывающих  процесс формирования на рынке г. Челябинска  продажной стоимости  двухкамерных холодильников.

     Так как линейная модель имеет ошибочную спецификацию, то сразу перейдем к рассмотрению логарифмической и полулогарифмической модели.

     Для сравнения логарифмической и  полулогарифмической модели воспользуемся  J-тестом, для этого составим прогноз цены для логарифмической модели (LPRICEF) и прогноз цены для полулогарифмической модели (PRICEFL). Затем построим следующие регрессии:

     Для полулогарифмической:

     LOG(PRICE) = C(1) + C(2)*COLOUR_WRITE + C(3)*ELECTRONNOE + C(4)*CLASS_A + C(5)*SOXL + C(6)*RAZMOR_MK + C(7)*VHK + C(8)*DEPTH + C(9)*INDESIT + C(10)*BOSCH + C(11)*WHIRLPOOL + C(12)*LPRICEF

     Для логарифмической:

     LOG(PRICE) = C(1) + C(2)*COLOUR_WRITE + C(3)*ELECTRONNOE + C(4)*CLASS_A + C(5)*SOXL + C(6)*RAZMOR_MK + C(7)*LOG(VHK) + C(8)*LOG(DEPTH) + C(9)*INDESIT + C(10)*BOSCH + C(11)*WHIRLPOOL + C(12)*PRICEFL

     При проведении сравнения между полулогарифмической и логарифмической моделями посредством применения J-теста получены следующие результаты:

Информация о работе Моделирование продажной стоимости двухкамерного холодильника