Регрессия

Автор работы: Пользователь скрыл имя, 31 Января 2017 в 23:11, контрольная работа

Описание работы

Необходимо:
1. Построить поле корреляции.
2. Рассчитать параметры парной линейной регрессии и объяснить их смысл.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Вычислить стандартную ошибку оценки регрессии.
5. Вычислить точечный прогноз реализации товара для х=х0 .

Файлы: 1 файл

Регрессия на 8.10.docx

— 102.47 Кб (Скачать файл)

 

Задача для самостоятельного решения №1

 

Получены данные о продаже товара Y млн. грн при общем объеме товарооборота X  млрд. грн.  Построить линейную парную регрессию Y на X.

X

8,1

8,3

9

9,2

9,9

10,9

11

11,1

12,3

11,5

Y

13

13,2

13,5

14,1

14,3

14,6

15

15,2

16,1

16,5


 

Необходимо:

1.  Построить  поле корреляции.

2. Рассчитать  параметры парной линейной регрессии  и объяснить их смысл.

3. Оцените  тесноту связи с помощью показателей  корреляции и детерминации.

4. Вычислить  стандартную ошибку оценки регрессии.

5. Вычислить  точечный прогноз реализации  товара для х=х0 .

6.Найти 95% интервалы:

    • для коэффициента корреляции;
    • математического ожидания  ;
    • индивидуального значения ;
    • для параметра β1 регрессионной модели;
    • для параметра .

7.Оценить  на уровне значимости  значимость уравнения регрессии Y по Х:

    • Используя F – критерий Фишера;
    • Используя t – распределение Стьюдента.

Уровень значимости принять равным α 0,05.

8.По данным таблиц  построенной линейной парной  регрессии Y  на X, где Y – продажа товара,  X – общий объем товарооборота, требуется:  исследовать отклонения на наличие автокорреляции на основе алгоритма Дарбина–Уотсона. Уровень значимости принять равным α = 0,1.

 

 

 

Решение

Поле корреляции

Судя по полученной диаграмме можно предполагать линейную зависимость. Найдем коэффициенты уравнения регрессии.

Применим метод наименьших квадратов, для чего решаем систему уравнений:

Составим таблицу промежуточных вычислений:

№ п/п

x

y

x2

y2

x·y

1

8,1

13

65,61

169

105,3

2

8,3

13,2

68,89

174,24

109,56

3

9

13,5

81

182,25

121,5

4

9,2

14,1

84,64

198,81

129,72

5

9,9

14,3

98,01

204,49

141,57

6

10,9

14,6

118,81

213,16

159,14

7

11

15

121

225

165

8

11,1

15,2

123,21

231,04

168,72

9

12,3

16,1

151,29

259,21

198,03

10

11,5

16,5

132,25

272,25

189,75

Сумма

101,3

145,5

1044,71

2129,45

1488,29


Система уравнений имеет вид:

Получаем коэффициенты регрессии: b = 0,7753, a = 6,6961.

Уравнение регрессии имеет вид:

Для оценки тесноты связи найдем следующие параметры уравнения регрессии:

;

Выборочные дисперсии:

Среднеквадратическое отклонение:

;

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

Коэффициент детерминации:

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0,1<rxy<0,3: слабая; 0,3< rxy<0,5: умеренная; 0,5<rxy<0,7: заметная; 0,7<rxy <0,9: высокая; 0,9<rxy<1: весьма высокая;

В нашем случае связь между признаком Y фактором X весьма высокая и прямая.

Несмещенной оценкой дисперсии возмущений является величина:

S2 = 0,16 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).

S = 0,4 – стандартная ошибка оценки (стандартная ошибка регрессии).

Sa – стандартное отклонение случайной величины a.

Sb – стандартное отклонение случайной величины b.

Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.

(a + bxp ± ε) где tкрит (n – m – 1;α/2) = (8;0.025) = 2,306.

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и хp = 10.

Вычислим ошибку прогноза для уравнения регрессии y = bx + a:

y(10) = 0,775·10 + 6,696 = 14,449

14,449 ± 0,293

(14,16;14,74)

С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов. 
Вычислим ошибку прогноза для уравнения y = bx + a + ε:

 (13.48;15.42)

Доверительный интервал для коэффициента корреляции

Доверительные интервалы индивидуального значения .

(a + bxi ± ε)

где

tкрит (n – m – 1;α/2) = (8;0,025) = 2,306

 

8,1

12,98

1,06

11,92

14,04

8,3

13,13

1,04

12,09

14,17

9

13,67

1

12,68

14,67

9,2

13,83

0,99

12,84

14,82

9,9

14,37

0,97

13,4

15,34

10,9

15,15

0,98

14,17

16,13

11

15,22

0,99

14,24

16,21

11,1

15,3

0,99

14,31

16,29

12,3

16,23

1,07

15,16

17,31


 

С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

Доверительный интервал для математического ожидания:

В этом случае 2Ф(tkp) = γ

Ф(tkp) = γ/2 = 0,95/2 = 0,475

По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0,475

tkp(γ) = (0.475) = 1.96

(14,55 – 0,73;14.55 + 0.73) = (13,82;15,28)

С вероятностью 0,95 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.

Доверительный интервал для параметра β1.

(β – tкрит Sb; β + tкрит Sb)

(0,78 – 2,306·0,0929; 0,78 + 2,306·0,0929)

(0,561;0,99)

С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

Доверительный интервал для среднеквадратического отклонения.

S(1 – q) < σ < S(1 + q)

Найдем доверительный интервал для среднеквадратического отклонения с надежностью γ = 0,95 и объему выборки n = 10.

По таблице q=q(γ;n) определяем параметр q(0,95;10)=0,65 
1,17(1 – 0,65) < σ < 1,17(1 + 0,65).

0,41 < σ < 1,931

Таким образом, интервал (0,41;1,931) покрывает параметр σ с надежностью γ = 0,95

t-статистика. Критерий Стьюдента

tкрит (n – m – 1;α/2) = (8;0,025) = 2,306

Поскольку 8,35 > 2,306, то статистическая значимость коэффициента регрессии b подтверждается.

Поскольку 7,05 > 2,306, то статистическая значимость коэффициента регрессии a подтверждается.

F-статистика. Критерий Фишера.

Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5,32.

Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

Исследуем отклонения на наличие автокорреляции на основе алгоритма Дарбина –Уотсона.

Критерий Дарбина-Уотсона является наиболее известным для обнаружения автокорреляции.

При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин ei.

 

Составим таблицу:

y

13

12,98

0,0239

0,00057

0

13,2

13,13

0,0688

0,00474

0,00202

13,5

13,67

-0,17

0,0302

0,0589

14,1

13,83

0,27

0,0735

0,2

14,3

14,37

-0,0717

0,00514

0,12

14,6

15,15

-0,55

0,3

0,23

15

15,22

-0,22

0,0504

0,1

15,2

15,3

-0,1

0,0104

0,015

16,1

16,23

-0,13

0,0175

0,000922

16,5

15,61

0,89

0,79

1,04

     

1,28

1,76


 

Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона:

Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 10 и количества объясняющих переменных m=1.

Автокорреляция отсутствует, если выполняется следующее условие: 
d1 < DW и d2 < DW < 4 – d2.

Автокорреляция остатков отсутствует, если 1,5 < DW < 2,5.

Поскольку 1,5 > 1,38 < 2,5, то автокорреляция остатков присутствует.

 

Литература

  1. Новиков А.И.  Эконометрика: Учеб.пособие. - М.: ИНФРА-М, 2010. - 144 с.
  2. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 2001. - XIV, - 402с.
  3. Елисеева И.И. Эконометрика: Учебник - М.: Финансы и статистика, 2007.-576 с.
  4. Магнусян Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.: Дело, 2001. - 454 с.
  5. Кремер Н.Ш., Путко Б.А. Эконометрика. – М.: ЮНИТИ-ДАНА, 2002. – 435 с.
  6. Домбровский В.В. Эконометрика – М.: Новый учебник, 2004. – 342 с.

 

 

 


Информация о работе Регрессия