Построение факторных регрессионных моделей

Автор работы: Пользователь скрыл имя, 26 Апреля 2016 в 21:53, контрольная работа

Описание работы

1. Постройте поля корреляции y и x1, y и x2, y и x3 и сформулируйте гипотезы о форме и направлении связей.

Анализируя корреляционное поле можно предположить о наличии слабой и прямой линейной связи между Y и X1

Файлы: 1 файл

Vypolnenie_raboty.docx

— 178.04 Кб (Скачать файл)

 

 

 

9. Рассчитайте прогнозное значение результата , если значение фактора (xp) составит указанный в варианте задания процент прироста от среднего уровня ( ). В модели множественной регрессии аналогично определите значение для прогноза второго фактора.

Рассчитаем для каждого фатора, который входит в модель прогнозные значения:

 

 

10. Рассчитайте доверительный интервал прогноза (для уровня значимости a), верхнюю и нижнюю границу доверительного интервала для каждого наблюдения, включая наблюдения для прогноза.

Для каждого наблюдения и для прогноза рассчитаем доверительный интервал прогноза для модели Y=5691,682-10,829X3

 

Табл. 6. – Рассчет интервального прогноза результата

i

Y

X0

X3

Предсказанное Y

s_f

Нижние 95%

Верхние 95%

12

21140,0

1

-1770,0

24 859,80

7 330,54

2 778,20

46 941,40

10

18501,1

1

-1744,2

24 580,40

7 305,06

2 575,55

46 585,24

4

12836,9

1

-1599,8

23 016,63

7 175,48

1 402,11

44 631,14

5

24789,0

1

-1553,0

22 509,81

7 138,35

1 007,13

44 012,49

11

23180,0

1

-1454,0

21 437,69

7 067,93

147,13

42 728,26

6

26025,0

1

-1179,0

18 459,60

6 932,45

-2 422,85

39 342,04

15

31065,0

1

-1124,0

17 863,98

6 916,29

-2 969,81

38 697,76

13

21127,0

1

-761,0

13 932,89

6 903,60

-6 862,64

34 728,42

8

11942,0

1

-696,0

13 228,97

6 918,58

-7 611,70

34 069,65

7

17032,0

1

-683,0

13 088,19

6 922,20

-7 763,39

33 939,78

14

4376,0

1

-344,0

9 417,01

7 088,53

-11 935,58

30 769,60

3

7217,8

1

-234,6

8 232,27

7 170,76

-13 368,05

29 832,59

9

4931,9

1

-221,5

8 090,40

7 181,51

-13 542,28

29 723,08

2

4835,7

1

-186,8

7 714,62

7 210,87

-14 006,51

29 435,76

1

4898,4

1

-163,8

7 465,55

7 231,06

-14 316,39

29 247,48

               

Прогноз

 

1

-947,23

15 949,64

6 889,66

-4 803,90

36 703,19


 

11. Дайте интервальные оценки параметрам лучшей модели на уровне значимости a.

 

Определим доверительный интервал для коэффициентов регресии

При доверительной вероятности 0,01 и степени свободы равной n-m-1=15-1-1=13  табличное значение критерия Стьюдента быдет равно:

 

Формула доверительного интервала будет иметь вид:

 

Для

(5691,682-3,012*3002,266; 5691,682+3,012*3002,266)

(-3351,971; 14735,336)

Для

(-10,829-3,012*2,762; -10,829+3,012*2,762)

(-19,148; -2,511)

 

12. Постройте на графике в координатах Y и ведущего фактора модели (единственного фактора парной регрессии либо того X множественной регрессии, который теснее других связан с Y):

  • исходные наблюдения (точки без соединительных линий);
  • прямую регрессии (сплошная линия без маркеров);
  • границы доверительного интервала прогноза для всех наблюдений (пунктирные линии без маркеров).

 

 

Рис. 7. Корреляционное поле с уравнением регресии и доверительныйм интервалом прогноза для Y и X3

 

 

Дополнительные задания

1*. Рассчитайте параметры лучшей  модели регрессии вручную, либо  в Excel с использованием только  формул матричного умножения. Рассчитайте  вручную стандартные ошибки параметров 

 

Расширенная матрица независимых переменных Z

X0

X3

1

-163,8

1

-186,8

1

-234,6

1

-1599,8

1

-1553

1

-1179

1

-683

1

-696

1

-221,5

1

-1744,2

1

-1454

1

-1770

1

-761

1

-344

1

-1124


 

Столбец значений зависимой переменной Y

Y

4898,4

4835,7

7217,8

12836,9

24789

26025

17032

11942

4931,9

18501,1

23180

21140

21127

4376

31065


 

Матрица ZTZ

15

-13714,7

-13714,7

17728021,77


 

Матрица (ZTZ)-1

0,227786584

0,00017622

0,00017622

1,92734E-07


 

Матрица ZTY

233897,8

-270044320,7


 

Вектор оценок коэффициентов регрессии равен

YX = | 0228;0000176;0000176;0 • | 2338978;-27004432065 = | 5691683;-10829

Уравнение регрессии (оценка уравнения регрессии)

Y = 5691.68-10.83X3

 

Оценка дисперсии равна:

se2 = (Y - X*Y(X))T(Y - X*Y(X)) = 514414946.9

Несмещенная оценка дисперсии равна:

s2 = 1;n-m-1 s2e =  1;15 - 1 - 1514414946.9 = 39570380.53

Оценка среднеквадратичного отклонения (стандартная ошибка для оценки Y):

S = S2 =  39570380.53 = 6290.5

Найдем оценку ковариационной матрицы вектора k = S2 • (XTX)-1

kx = 39570380.53| 0228;0000176;0000176;0 = | 901360182;6973076;6973076;7627

Дисперсии параметров модели

Sa0 = 9013601.82 = 3002.266

Sa1 = 7.627 = 2.762

 

 

 

2*. Постройте график остатков  для лучшей модели. Проведите  тесты остатков на постоянство  дисперсии (по F-критерию), отсутствие  автокорреляции (коэффициент автокорреляции  остатков первого порядка), на равенство среднего значения остатков нулю. Сделайте выводы о пригодности данной модели для прогнозирования.

 

График остатков c наиболее значимым фактором X3

Рис. 8. График остатков в зависимости от фактора X3

 

 

Проверим гипотезу на однородность дисперсии, для этого отсортируем остатки по X3

 

 

 

 

 

 

Табл. 7. – Рассчет остатков

 

N

Y

Предсказанное Y

X1

e

12

21140

24859,8

-1770

-3719,80

10

18501,1

24580,4

-1744,2

-6079,30

4

12836,9

23016,6

-1599,8

-10179,73

5

24789

22509,8

-1553

2279,19

11

23180

21437,7

-1454

1742,31

6

26025

18459,6

-1179

7565,40

15

31065

17864,0

-1124

13201,02

13

21127

13932,9

-761

7194,11

8

11942

13229,0

-696

-1286,97

7

17032

13088,2

-683

3943,81

14

4376

9417,0

-344

-5041,01

3

7217,8

8232,3

-234,6

-1014,47

9

4931,9

8090,4

-221,5

-3158,50

2

4835,7

7714,6

-186,8

-2878,92

1

4898,4

7465,5

-163,8

-2567,15


 

H0: дисперсия остатков  однородна

H1: дисперсия остатков  неоднородна

 

Воспользуемся анализом данных в Excel

 

 

 

Проверим гипотезу на постоянство средних остатков. Воспользуемся анализом данных. Так как оказалось, что дисперсия одинаковая, то воспользуемся тестом для одинаковых дисперсий

 

H0: среднее остатков постоянно

H1: среднее остатков не  постоянно

 

 

 

Проверим авторреляцию остатков для этого осортируем данные по номеру

 

Коэффициент автокорреляции первого порядка

   

Автокорреляция

-0,200

t-статистика

-0,700

t критическое

3,055


 

Таким образом, r=-0,2 . Проверяем на значимость

 

 

 

3*. Проверить модель множественной  регрессии на мультиколлинеарность  факторов с помощью VIF-коэффициентов.

 

Построим модель для факторов X2 и X3

 

Проверим модель Y=4060,011+1,004X2-7,211X3 на мультиколлинеарность, для этого воспользуемся корреляционной матрице, которая была найдена в начале

 

Табл. 8 – Корреляционная матрица

 

Y

X1

X2

X3

Y

1,000

     

X1

0,500

1,000

   

X2

0,696

0,029

1,000

 

X3

-0,736

-0,225

-0,763

1,000


 

Все вычисления построим в таблице

 

Табл. 9 – Рассчет критерия VIF

 

Общий вид модели

R-квадрат

VIF

Y=3019,435+1,725X1+1,202X2

0,585

X2=f(X3)

   

X3=f(X2)

   

Информация о работе Построение факторных регрессионных моделей