Построение и анализ парной и множественной регрессий

Автор работы: Пользователь скрыл имя, 09 Сентября 2009 в 17:24, Не определен

Описание работы

Контрольно-курсовая работа по курсу «Эконометрика»

Файлы: 1 файл

ккр.doc

— 1.47 Мб (Скачать файл)

2.6.Построение доверительных интервалов для коэффициентов модели с выбранным уровнем значимости. Проверка значимости каждого коэффициента

 

    Для оценки статистической значимости коэффициентов регрессии рассчитываются t-критерий  Стьюдента и доверительные интервалы каждого из параметров. Выдвигается гипотеза о случайной природе показателей, т.е. о незначимом их отличии от нуля. Получим набор гипотез:

     : b0 =0;b1 =0;b2 =0;b3 =0

      Оценка значимости коэффициентов  регрессии с помощью t-критерия Стьюдента проводится путем сопоставления их значений с табличным значением , вычисляемым как квантиль распределения Стьюдента, где уровень значимости - вероятность отвергнуть правильную гипотезу при условии, что она верна.

     ,

     ,

    

    Значения , , < , значит коэффициенты являются статистически незначимыми и случайно отличаются от 0.

      > , значит является статистически значимым

    Для расчета доверительных интервалов пользуются следующей формулой:

     .

    Для построенной модели доверительные  интервалы коэффициентов регрессии:

    

    Вывод: все полученные коэффициенты регрессии, кроме , статистически незначимы, доверительные интервал для них достаточно большой, что может свидетельствовать о недостаточном качестве модели.

2.7. Оценка тесноты связи, скорректированный и нескорректированный коэффициенты детерминации

    Качество  построенной модели в целом оценивает  коэффициент детерминации. Коэффициент  множественной детерминации рассчитывается, как квадрат индекса множественной  корреляции: .

    Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле:

    

    где n – число наблюдений;

        m – число факторов.

    Для построенной модели

    

    Вывод: Данный коэффициент детерминации показывает, что качество модели удовлетворительное.

    С добавлением еще одной переменной обычно увеличивается. Для того чтобы не допускать возможного преувеличения тесноты связи и применяется скорректированный коэффициент детерминации. При заданном объеме наблюдений при прочих равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. Для построенной модели значения скорректированного и нескорректированного коэффициента детерминации не значительно отличаются друг от друга, но т.к. скорректированный коэффициент детерминации  немного уменьшился можно предположить, что увеличение доли объясненной регрессии при добавлении новой переменной незначительно, и что добавлять переменную нецелесообразно.

2.8. Оценка статистической надежности уравнения регрессии с помощью F – критерия Фишера.

    Значимость  уравнения множественной регрессии  в целом, так же как и в парной регрессии, оценивается с помощью  F-критерия Фишера:

    

    При этом выдвигается гипотеза о незначимости уравнения регрессии:

    

    

    

    Так как Fтабл< Fфакт    то не принимается

    Вывод: уравнение множественной регрессии значимо, т.е. отвергается гипотеза о случайной природе оцениваемых характеристик. Полученная модель статистически надежна.

2.9. Прогнозное значение  результата для  нового набора  факторов, доверительный  интервал прогноза

    Рассмотрим  прогнозное значение набора факторов, увеличившееся на 10% от своего среднего уровня:

     =(1;19;930;340)

      .

    Доверительный интервал прогноза: ,

    где дисперсия ошибки прогноза: ,

     , тогда 

    

    

    Вывод: в доверительный интервал прогноза входит ноль, значит прогноз недостоверный, и его использование не целесообразно.

2.10. Исследование остатков регрессии е.

    Для исследования остатков построим графики зависимости остатков от величин

 
 
 

 

 

    На  основании графиков можно сделать  вывод о том, что остатки неравномерно разбросаны по осям y^ и факторов x2 и x3, т.е. остатки не имеют постоянной дисперсии. Это говорит о том, что в данной модели может наблюдаться гетероскедастичность, т.е. предпосылки МНК не выполняются.   Следовательно, можно предположить, что модель требует корректировки. В этом случае необходимо либо применять другую функцию, либо вводить информацию и заново строить уравнение регрессии до тех пор, пока остатки не будут случайными величинами.

2.11. Модель с фиктивной  переменной

    Для исследования влияния качественного  признака введем в модель фиктивную  переменную. В качестве фиктивной  переменной рассмотрим площадь территории страны.

         X4 =  1, площадь страны больше 100 тыс. км2

                 0, площадь страны меньше 100 тыс.  км2

    Страна      x
    Россия     1
    Бельгия     0
    Венгрия     0
    Греция     1
    Кипр     0
    Латвия     0
    Литва     0
    Мальта     0
    Нидерланды     0
    Польша     1
    Португалия     0
    Румыния     1
    словакия     0
    Словения     0
    Великобритания     1
    Финляндия     1
    Франция     1
    Чешская Респ     0
    Швеция     1
    Эстония     0
 

    Найдем  оценки параметров уравнения множественной  регрессии с фиктивной переменной. Подробные расчеты представлены в приложении 9.

    

    Уравнение множественной регрессии примет вид:

    

    Оценку  дисперсии ошибок рассчитаем по формуле:

    

     = 7115,527

    Оценки  дисперсий параметров модели найдем по формуле:

     ,

    где индекс ii означает, что в соответствующей матрице возьмем диагональные элементы. 

    

    Выдвигается гипотеза о случайной природе коэффициентов bi, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии с помощью t-критерия Стьюдента проводится путем сопоставления их значений с табличным значением , вычисляемым как квантиль распределения Стьюдента. Уровень значимости примем . Расчетное значение вычислим по формуле:

    

    

    

    Так как  < для коэффициентов b0, b1, b2, b4, то данные коэффициенты статически незначимы. Переменная b3 статистически значима. Фиктивная переменная статически незначима, случайно отличается от нуля.

Коэффициент детерминации для модели с фиктивными переменными немного увеличился: =0,589465994

    Проверим  его на значимость.

    

    

      

     > , следовательно гипотеза отвергается, коэффициент детерминации в модели с фиктивными переменными значим.

    Вывод: Т.к. фиктивная переменная статистически незначима и  коэффициенты детерминации для моделей с фиктивной переменной и без нее принимают практически равные значения, различия, которые учитываются фиктивной переменной, не существенны и ее ввод в эконометрическую модель нецелесообразен. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

ЗАКЛЮЧЕНИЕ

      В результате построения множественной  регрессии исследовано влияние  на число прибывших в страну на постоянное место жительства таких  факторов, как ВВП страны, численность  безработных и средняя годовая заработная плата наемных рабочих.

      В результате анализа были получены следующие  выводы.

    Изменение числа прибывших в страну на постоянное место жительства находится в прямой зависимости от годовой заработной платы наемных рабочих и величины уровня ВВП страны и в обратной зависимости от численности безработных. Наибольшее изменение числа прибывших в страну вызывает величина ВВП, а наименьшее – численность безработных.

     Совместное влияние всех факторов на  число прибывших в страну на постоянное место жительства достаточно велико, поскольку индекс множественной корреляции принимает высокое значение. Однако это может объясняться наличием мультиколлинеарности.

      Все полученные коэффициенты уравнения множественной регрессии кроме коэффициента при факторе уровень ВВП статистически незначимы, доверительные интервал для них достаточно большой.

      Не  смотря на это, коэффициент детерминации показывает, что качество модели удовлетворительное. Уравнение множественной регрессии значимо, т.е. отвергается гипотеза о случайной природе оцениваемых характеристик.

      Однако  в модели может наблюдаться гетероскедастичность, т.е. возможно необходима коррекция модели.

      Ввод фиктивной переменной не привел к изменению значимости коэффициентов регрессии. Фиктивная переменная статистически незначима. Следовательно, различия, которые ею учитываются, не существенны.

      Данные  результаты можно объяснить достаточно малым объемом выборки, в особенности с учетом глобальности исследования, наличием аномального значения исследуемого признака, неучтенностью каких-либо существенных факторов,  а также тем, что число эмигрантов в страну зависит от большого числа не количественных, личных факторов, индивидуальных предпочтений.

      Не  смотря на отсутствие точного результата и качественного уравнения регрессии, пригодного для прогнозирования и дальнейших исследований, в ходе исследования удалось выявить, что заработная плата наемных рабочих в стране, уровень безработицы и ВВП оказывают немаловажное влияние на число прибывших в страну на постоянное место жительства.   

Информация о работе Построение и анализ парной и множественной регрессий