Построение и анализ парной и множественной регрессий

Автор работы: Пользователь скрыл имя, 09 Сентября 2009 в 17:24, Не определен

Описание работы

Контрольно-курсовая работа по курсу «Эконометрика»

Файлы: 1 файл

ккр.doc

— 1.47 Мб (Скачать файл)

m-число параметров при переменных х.

    Линейная  модель

=6,150512218

    Показательная зависимость

=4,6394274

    Квадратичная  зависимость

=11,6775003

    Кубическая  зависимость

=19,25548322

    Во  всех рассмотренных моделях  < , т.е. гипотеза отвергается.

    Вывод: все полученные уравнения регрессии значимы. По результатам F-теста, а также рассмотренным выше показателям коэффициента детерминации и средней ошибки аппроксимации можно сделать вывод что среди рассмотренных моделей нет модели с хорошим качеством, которую можно было бы применять с целью прогнозирования. Однако, наилучшей моделью, описывающей взаимосвязь между годовой з/п наемных рабочих страны и числом прибывших в страну на постоянное место жительства, является модель с кубической зависимостью , поскольку она является значимой, коэффициент детерминации принимает наибольшее значение и средняя ошибка аппроксимации не так велика по сравнению с другими моделями, хотя и не принимает допустимого значения.

1.8. Проверка значимости коэффициентов модели, построение доверительных интервалов с заданным уровнем значимости

    В линейной регрессии обычно оценивается  значимость не только уравнения в  целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка:

       

;

    

    Отношение коэффициента регрессии к его  стандартной ошибке дает t-статистику, которая подчиняется статистике Стьюдента при (n-2) степенях свободы. Данная статистика применяется для проверки значимости коэффициента регрессии и для расчета его доверительных интервалов. Выдвигается гипотеза о случайной природе показателей, т.е. о незначимом их отличии от нуля.

    

: a=0;

    

: b=0;

    

    Сравнивая фактическое и табличное значение t – статистики, принимаем или  отвергаем гипотезу .

    Если |tфакт|>tтабл, то отклоняется, т.е. a и b не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x, иначе принимается.

    Формулы для расчета доверительных интервалов имеют следующий вид:

    

,

    

.

(0.05;18)= 2,100922 

    Линейная  модель

    

    Так как |tа|< tтабл, то гипотеза H0  принимается, параметр а статистически незначим.

    Так как tтабл <|tb|, то параметр b статистически значим, гипотеза H0 отвергается.

    Доверительный интервал для a и b соответственно примет вид:

    a (-95,96059459; 65,55464)

    b (0,654074835; 7,903656)          

    Т.е. с вероятностью 0,95 параметр a и параметр b, находясь в указанных границах. Параметр a принимает нулевые значения, т. е. является статистически незначимыми. Параметр b значим.  

    Показательная зависимость

    

    Так как tа < tтабл, то гипотеза H0 принимается, параметр а статистически незначим.

    Так как tb< tтабл, то параметр b статистически незначим, гипотеза принимается.

    Доверительный интервал для a и b соответственно примет вид:

a (-39,34125; 50,07762)

b (-2,673413;4,8142)          

    Т.е. с вероятностью 0,95 параметр a и параметр b, находясь в указанных границах. Параметр a и b принимают нулевые значения, т. е. являются статистически незначимыми.   

    Квадратичная  зависимость

    

    Так как tа < tтабл, то гипотеза H0 принимается, параметр а статистически незначим.

    Так как tтабл <tb, то параметр b статистически значим, гипотеза отвергается.

    Доверительный интервал для a и b соответственно примет вид:

    a (-56,178325; 58,37749)

    b (0,04633371; 0,194237)          

    Т.е. с вероятностью 0,95 параметр a и параметр b, находясь в указанных границах. Параметр a принимает нулевые значения, т. е. является статистически незначимыми. Параметр b значим.  

    Кубическая  зависимость

    

    Так как tа < tтабл, то гипотеза H0 принимается, параметр а статистически незначим.

    Так как tтабл <tb, то параметр b статистически значим, гипотеза отвергается.

    Доверительный интервал для a и b соответственно примет вид:

    a (-43,3715931; 51,96166)

    b (0,001769445; 0,00502)          

    Т.е. с вероятностью 0,95 параметр a и параметр b, находясь в указанных границах. Параметр a принимает нулевые значения, т. е. является статистически незначимыми. Параметр b значим.

    Более подробные данные о полученных результатах  приведены в приложении 6.

    Вывод: во всех рассмотренных моделях параметр a является статистически незначимым. Для показательной зависимости не значимыми являются оба параметра.

1.9. Расчет прогнозного значения результата. Определение доверительного интервала прогноза

    Прогнозное  значение определяется путем подстановки в уравнение регрессии соответствующего прогнозного значения .

    Кроме того, необходимо вычислить стандартную ошибку прогноза

     ,

     .

    Так же для наиболее точной оценки прогноза строится доверительный интервал:

     .

     =t(0.05,18)= 2,100922

    Прогнозное  значение фактора увеличилось на 10% от его среднего уровня: =19,5399402

    Линейная  модель

    Прогнозное  значение числа прибывших в страну на постоянное место жительства при годовой з/п наемных рабочих равной 19,5399402 составит:

     = 68,40579766

    Ошибка  прогноза составит:

     = 106,3619856

    Доверительный интервал прогноза:

     ( -155,0524418; 291,864)

    Показательная зависимость

    Прогнозное  значение числа прибывших в страну на постоянное место жительства при  годовой з/п наемных рабочих  равной 19,54 составит:

     = 20,28185

    Ошибка  прогноза составит:

     = 109,85426

    Доверительный интервал прогноза:

     ( -210,5134; 251,0771)

     Квадратичная  зависимость

     Прогнозное  значение числа прибывших в страну на постоянное место жительства при  годовой з/п наемных рабочих  равной 19,54 составит:

     = 47,0256261

    Ошибка  прогноза составит:

     = 95,9928932

    Доверительный интервал прогноза:

     ( -154,64796; 248,6992)

    Кубическая  зависимость

     Прогнозное  значение числа прибывших в страну на постоянное место жительства при годовой з/п наемных рабочих равной 19,54 составит:

= 29,62197186

Ошибка  прогноза составит:

= 85,89453709

Доверительный интервал прогноза:

( -150,835754; 210,0797)

     Вывод: более точный из всех прогнозов дает модель с кубической зависимостью, так как данная модель имеет наименьшую стандартную ошибку прогноза и диапазон верхней и нижней границ доверительного интервала меньше, чем у других моделей. Однако даже в этой модели значения стандартной ошибки прогноза, а также диапазон верхней и нижней границы  интервала принимают очень большие значения, включают нулевые и отрицательные значения, что не дает возможности сделать достоверный прогноз.

1.10. Выбор лучшего уравнения регрессии

     В результате исследования было выяснено, что все четыре модели парной регрессии являются статистически значимыми, однако достаточно малые значения коэффициента детерминации, большие ошибки средней аппроксимации свидетельствуют о плохом качестве данных моделей.

     Тем не менее, сравнив параметры и характеристики данных уравнений, приходим к выводу, что наибольшей надежность и точностью обладает модель с кубической зависимостью:

     Об  этом свидетельствуют  наибольшее значение индекса корреляции и соответственно коэффициент детерминации, наиболее близкий к 1 и подтверждающий лучшее качество модели с точки зрения аппроксимации данных, результаты  F-теста, признавшие модель значимой,  а также средняя ошибка аппроксимации, меньшая, чем у других моделей. Стандартные ошибки параметров регрессии и стандартная ошибка прогноза для этой модели также принимают меньшие значения.

1.11. Проверка гипотезы о несущественности перехода от линейной модели к нелинейной

     Для обоснования использования нелинейных функций необходимо провести сравнение индексов детерминации для нелинейной модели и коэффициента детерминации линейной модели с одним и тем же набором факторов.

     Практически установлено, что если разность | - | < 0,1, то можно использовать линейную функцию, в противном случае проводится оценка существенности различия по критерию Стьюдента.

     Для этого выдвигается нулевая гипотеза:

     H0: = ,

     H1: ,

     Используется  следующая статистика:

      ,

     Где  

     Если |tрасч| < tтаб, принимается гипотеза H0, и различия между моделями незначительны.

     Если |tрасч|  > tтаб, принимается гипотеза H1, различия между моделями значительны.

     Показательная зависимость

     | - | = 0,2049269- 0,254674193= -0,04974731

     | - | < 0,1

     Значит, можно использовать линейную функцию, переход к показательной функции нецелесообразен.

     Квадратичная  зависимость

     | - | = 0,39347992- 0,254674193= 0,138805722

     | - | > 0,1

     Выдвигаем нулевую гипотеза:

Информация о работе Построение и анализ парной и множественной регрессий