Автор работы: Пользователь скрыл имя, 26 Апреля 2016 в 21:53, контрольная работа
1. Постройте поля корреляции y и x1, y и x2, y и x3 и сформулируйте гипотезы о форме и направлении связей.
Анализируя корреляционное поле можно предположить о наличии слабой и прямой линейной связи между Y и X1
9. Рассчитайте прогнозное значение результата , если значение фактора (xp) составит указанный в варианте задания процент прироста от среднего уровня ( ). В модели множественной регрессии аналогично определите значение для прогноза второго фактора.
Рассчитаем для каждого фатора, который входит в модель прогнозные значения:
10. Рассчитайте доверительный интервал прогноза (для уровня значимости a), верхнюю и нижнюю границу доверительного интервала для каждого наблюдения, включая наблюдения для прогноза.
Для каждого наблюдения и для прогноза рассчитаем доверительный интервал прогноза для модели Y=5691,682-10,829X3
Табл. 6. – Рассчет интервального прогноза результата
i |
Y |
X0 |
X3 |
Предсказанное Y |
s_f |
Нижние 95% |
Верхние 95% |
12 |
21140,0 |
1 |
-1770,0 |
24 859,80 |
7 330,54 |
2 778,20 |
46 941,40 |
10 |
18501,1 |
1 |
-1744,2 |
24 580,40 |
7 305,06 |
2 575,55 |
46 585,24 |
4 |
12836,9 |
1 |
-1599,8 |
23 016,63 |
7 175,48 |
1 402,11 |
44 631,14 |
5 |
24789,0 |
1 |
-1553,0 |
22 509,81 |
7 138,35 |
1 007,13 |
44 012,49 |
11 |
23180,0 |
1 |
-1454,0 |
21 437,69 |
7 067,93 |
147,13 |
42 728,26 |
6 |
26025,0 |
1 |
-1179,0 |
18 459,60 |
6 932,45 |
-2 422,85 |
39 342,04 |
15 |
31065,0 |
1 |
-1124,0 |
17 863,98 |
6 916,29 |
-2 969,81 |
38 697,76 |
13 |
21127,0 |
1 |
-761,0 |
13 932,89 |
6 903,60 |
-6 862,64 |
34 728,42 |
8 |
11942,0 |
1 |
-696,0 |
13 228,97 |
6 918,58 |
-7 611,70 |
34 069,65 |
7 |
17032,0 |
1 |
-683,0 |
13 088,19 |
6 922,20 |
-7 763,39 |
33 939,78 |
14 |
4376,0 |
1 |
-344,0 |
9 417,01 |
7 088,53 |
-11 935,58 |
30 769,60 |
3 |
7217,8 |
1 |
-234,6 |
8 232,27 |
7 170,76 |
-13 368,05 |
29 832,59 |
9 |
4931,9 |
1 |
-221,5 |
8 090,40 |
7 181,51 |
-13 542,28 |
29 723,08 |
2 |
4835,7 |
1 |
-186,8 |
7 714,62 |
7 210,87 |
-14 006,51 |
29 435,76 |
1 |
4898,4 |
1 |
-163,8 |
7 465,55 |
7 231,06 |
-14 316,39 |
29 247,48 |
Прогноз |
1 |
-947,23 |
15 949,64 |
6 889,66 |
-4 803,90 |
36 703,19 |
11. Дайте интервальные оценки параметрам лучшей модели на уровне значимости a.
Определим доверительный интервал для коэффициентов регресии
При доверительной вероятности 0,01 и степени свободы равной n-m-1=15-1-1=13 табличное значение критерия Стьюдента быдет равно:
Формула доверительного интервала будет иметь вид:
Для
(5691,682-3,012*3002,266; 5691,682+3,012*3002,266)
(-3351,971; 14735,336)
Для
(-10,829-3,012*2,762; -10,829+3,012*2,762)
(-19,148; -2,511)
12. Постройте на графике в координатах Y и ведущего фактора модели (единственного фактора парной регрессии либо того X множественной регрессии, который теснее других связан с Y):
Рис. 7. Корреляционное поле с уравнением регресии и доверительныйм интервалом прогноза для Y и X3
1*. Рассчитайте параметры лучшей
модели регрессии вручную, либо
в Excel с использованием только
формул матричного умножения. Рассчитайте
вручную стандартные ошибки
Расширенная матрица независимых переменных Z
X0 |
X3 |
1 |
-163,8 |
1 |
-186,8 |
1 |
-234,6 |
1 |
-1599,8 |
1 |
-1553 |
1 |
-1179 |
1 |
-683 |
1 |
-696 |
1 |
-221,5 |
1 |
-1744,2 |
1 |
-1454 |
1 |
-1770 |
1 |
-761 |
1 |
-344 |
1 |
-1124 |
Столбец значений зависимой переменной Y
Y |
4898,4 |
4835,7 |
7217,8 |
12836,9 |
24789 |
26025 |
17032 |
11942 |
4931,9 |
18501,1 |
23180 |
21140 |
21127 |
4376 |
31065 |
Матрица ZTZ
15 |
-13714,7 |
-13714,7 |
17728021,77 |
Матрица (ZTZ)-1
0,227786584 |
0,00017622 |
0,00017622 |
1,92734E-07 |
Матрица ZTY
233897,8 |
-270044320,7 |
Вектор оценок коэффициентов регрессии равен
YX = | 0228;0000176;0000176;0 • | 2338978;-27004432065 = | 5691683;-10829
Уравнение регрессии (оценка уравнения регрессии)
Y = 5691.68-10.83X3
Оценка дисперсии равна:
se2 = (Y - X*Y(X))T(Y - X*Y(X)) = 514414946.9
Несмещенная оценка дисперсии равна:
s2 = 1;n-m-1 s2e = 1;15 - 1 - 1514414946.9 = 39570380.53
Оценка среднеквадратичного отклонения (стандартная ошибка для оценки Y):
S = S2 = 39570380.53 = 6290.5
Найдем оценку ковариационной матрицы вектора k = S2 • (XTX)-1
kx = 39570380.53| 0228;0000176;0000176;0 = | 901360182;6973076;6973076;7627
Дисперсии параметров модели
Sa0 = 9013601.82 = 3002.266
Sa1 = 7.627 = 2.762
2*. Постройте график остатков для лучшей модели. Проведите тесты остатков на постоянство дисперсии (по F-критерию), отсутствие автокорреляции (коэффициент автокорреляции остатков первого порядка), на равенство среднего значения остатков нулю. Сделайте выводы о пригодности данной модели для прогнозирования.
График остатков c наиболее значимым фактором X3
Рис. 8. График остатков в зависимости от фактора X3
Проверим гипотезу на однородность дисперсии, для этого отсортируем остатки по X3
Табл. 7. – Рассчет остатков
N |
Y |
Предсказанное Y |
X1 |
e |
12 |
21140 |
24859,8 |
-1770 |
-3719,80 |
10 |
18501,1 |
24580,4 |
-1744,2 |
-6079,30 |
4 |
12836,9 |
23016,6 |
-1599,8 |
-10179,73 |
5 |
24789 |
22509,8 |
-1553 |
2279,19 |
11 |
23180 |
21437,7 |
-1454 |
1742,31 |
6 |
26025 |
18459,6 |
-1179 |
7565,40 |
15 |
31065 |
17864,0 |
-1124 |
13201,02 |
13 |
21127 |
13932,9 |
-761 |
7194,11 |
8 |
11942 |
13229,0 |
-696 |
-1286,97 |
7 |
17032 |
13088,2 |
-683 |
3943,81 |
14 |
4376 |
9417,0 |
-344 |
-5041,01 |
3 |
7217,8 |
8232,3 |
-234,6 |
-1014,47 |
9 |
4931,9 |
8090,4 |
-221,5 |
-3158,50 |
2 |
4835,7 |
7714,6 |
-186,8 |
-2878,92 |
1 |
4898,4 |
7465,5 |
-163,8 |
-2567,15 |
H0: дисперсия остатков однородна
H1: дисперсия остатков неоднородна
Воспользуемся анализом данных в Excel
Проверим гипотезу на постоянство средних остатков. Воспользуемся анализом данных. Так как оказалось, что дисперсия одинаковая, то воспользуемся тестом для одинаковых дисперсий
H0: среднее остатков постоянно
H1: среднее остатков не постоянно
Проверим авторреляцию остатков для этого осортируем данные по номеру
Коэффициент автокорреляции первого порядка | |
Автокорреляция |
-0,200 |
t-статистика |
-0,700 |
t критическое |
3,055 |
Таким образом, r=-0,2 . Проверяем на значимость
3*. Проверить модель
Построим модель для факторов X2 и X3
Проверим модель Y=4060,011+1,004X2-7,211X3 на мультиколлинеарность, для этого воспользуемся корреляционной матрице, которая была найдена в начале
Табл. 8 – Корреляционная матрица
Y |
X1 |
X2 |
X3 | |
Y |
1,000 |
|||
X1 |
0,500 |
1,000 |
||
X2 |
0,696 |
0,029 |
1,000 |
|
X3 |
-0,736 |
-0,225 |
-0,763 |
1,000 |
Все вычисления построим в таблице
Табл. 9 – Рассчет критерия VIF
Общий вид модели |
R-квадрат |
VIF |
Y=3019,435+1,725X1+1,202X2 |
0,585 |
– |
X2=f(X3) |
||
X3=f(X2) |
Информация о работе Построение факторных регрессионных моделей