Автор работы: Пользователь скрыл имя, 31 Января 2017 в 23:11, контрольная работа
Необходимо:
1. Построить поле корреляции.
2. Рассчитать параметры парной линейной регрессии и объяснить их смысл.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Вычислить стандартную ошибку оценки регрессии.
5. Вычислить точечный прогноз реализации товара для х=х0 .
Задача для самостоятельного решения №1
Получены данные о продаже товара Y млн. грн при общем объеме товарооборота X млрд. грн. Построить линейную парную регрессию Y на X.
X |
8,1 |
8,3 |
9 |
9,2 |
9,9 |
10,9 |
11 |
11,1 |
12,3 |
11,5 |
Y |
13 |
13,2 |
13,5 |
14,1 |
14,3 |
14,6 |
15 |
15,2 |
16,1 |
16,5 |
Необходимо:
1. Построить поле корреляции.
2. Рассчитать
параметры парной линейной
3. Оцените
тесноту связи с помощью
4. Вычислить
стандартную ошибку оценки
5. Вычислить точечный прогноз реализации товара для х=х0 .
6.Найти 95% интервалы:
7.Оценить на уровне значимости значимость уравнения регрессии Y по Х:
Уровень значимости принять равным α 0,05.
8.По данным таблиц построенной линейной парной регрессии Y на X, где Y – продажа товара, X – общий объем товарооборота, требуется: исследовать отклонения на наличие автокорреляции на основе алгоритма Дарбина–Уотсона. Уровень значимости принять равным α = 0,1.
Решение
Поле корреляции
Судя по полученной диаграмме можно предполагать линейную зависимость. Найдем коэффициенты уравнения регрессии.
Применим метод наименьших квадратов, для чего решаем систему уравнений:
Составим таблицу промежуточных вычислений:
№ п/п |
x |
y |
x2 |
y2 |
x·y |
1 |
8,1 |
13 |
65,61 |
169 |
105,3 |
2 |
8,3 |
13,2 |
68,89 |
174,24 |
109,56 |
3 |
9 |
13,5 |
81 |
182,25 |
121,5 |
4 |
9,2 |
14,1 |
84,64 |
198,81 |
129,72 |
5 |
9,9 |
14,3 |
98,01 |
204,49 |
141,57 |
6 |
10,9 |
14,6 |
118,81 |
213,16 |
159,14 |
7 |
11 |
15 |
121 |
225 |
165 |
8 |
11,1 |
15,2 |
123,21 |
231,04 |
168,72 |
9 |
12,3 |
16,1 |
151,29 |
259,21 |
198,03 |
10 |
11,5 |
16,5 |
132,25 |
272,25 |
189,75 |
Сумма |
101,3 |
145,5 |
1044,71 |
2129,45 |
1488,29 |
Система уравнений имеет вид:
Получаем коэффициенты регрессии: b = 0,7753, a = 6,6961.
Уравнение регрессии имеет вид:
Для оценки тесноты связи найдем следующие параметры уравнения регрессии:
Выборочные дисперсии:
Среднеквадратическое отклонение:
;
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Коэффициент детерминации:
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0,1<rxy<0,3: слабая; 0,3< rxy<0,5: умеренная; 0,5<rxy<0,7: заметная; 0,7<rxy <0,9: высокая; 0,9<rxy<1: весьма высокая;
В нашем случае связь между признаком Y фактором X весьма высокая и прямая.
Несмещенной оценкой дисперсии возмущений является величина:
S2 = 0,16 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
S = 0,4 – стандартная ошибка оценки (стандартная ошибка регрессии).
Sa – стандартное отклонение случайной величины a.
Sb – стандартное отклонение случайной величины b.
Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.
(a + bxp ± ε) где tкрит (n – m – 1;α/2) = (8;0.025) = 2,306.
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и хp = 10.
Вычислим ошибку прогноза для уравнения регрессии y = bx + a:
y(10) = 0,775·10 + 6,696 = 14,449
14,449 ± 0,293
(14,16;14,74)
С вероятностью
95% можно гарантировать, что значения Y при неограниченно
большом числе наблюдений не выйдет за
пределы найденных интервалов.
Вычислим ошибку прогноза для уравнения y = bx + a + ε:
(13.48;15.42)
Доверительный интервал для коэффициента корреляции
Доверительные интервалы индивидуального значения .
(a + bxi ± ε)
где
tкрит (n – m – 1;α/2) = (8;0,025) = 2,306
8,1 |
12,98 |
1,06 |
11,92 |
14,04 |
8,3 |
13,13 |
1,04 |
12,09 |
14,17 |
9 |
13,67 |
1 |
12,68 |
14,67 |
9,2 |
13,83 |
0,99 |
12,84 |
14,82 |
9,9 |
14,37 |
0,97 |
13,4 |
15,34 |
10,9 |
15,15 |
0,98 |
14,17 |
16,13 |
11 |
15,22 |
0,99 |
14,24 |
16,21 |
11,1 |
15,3 |
0,99 |
14,31 |
16,29 |
12,3 |
16,23 |
1,07 |
15,16 |
17,31 |
С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.
Доверительный интервал для математического ожидания:
В этом случае 2Ф(tkp) = γ
Ф(tkp) = γ/2 = 0,95/2 = 0,475
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0,475
tkp(γ) = (0.475) = 1.96
(14,55 – 0,73;14.55 + 0.73) = (13,82;15,28)
С вероятностью 0,95 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Доверительный интервал для параметра β1.
(β – tкрит Sb; β + tкрит Sb)
(0,78 – 2,306·0,0929; 0,78 + 2,306·0,0929)
(0,561;0,99)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
Доверительный интервал для среднеквадратического отклонения.
S(1 – q) < σ < S(1 + q)
Найдем доверительный интервал для среднеквадратического отклонения с надежностью γ = 0,95 и объему выборки n = 10.
По таблице q=q(γ;n) определяем параметр q(0,95;10)=0,65
1,17(1 – 0,65)
< σ
< 1,17(1 + 0,65).
0,41 < σ < 1,931
Таким образом, интервал (0,41;1,931) покрывает параметр σ с надежностью γ = 0,95
t-статистика. Критерий Стьюдента
tкрит (n – m – 1;α/2) = (8;0,025) = 2,306
Поскольку 8,35 > 2,306, то статистическая значимость коэффициента регрессии b подтверждается.
Поскольку 7,05 > 2,306, то статистическая значимость коэффициента регрессии a подтверждается.
F-статистика. Критерий Фишера.
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5,32.
Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Исследуем отклонения на наличие автокорреляции на основе алгоритма Дарбина –Уотсона.
Критерий Дарбина-Уотсона является наиболее известным для обнаружения автокорреляции.
При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин ei.
Составим таблицу:
y |
||||
13 |
12,98 |
0,0239 |
0,00057 |
0 |
13,2 |
13,13 |
0,0688 |
0,00474 |
0,00202 |
13,5 |
13,67 |
-0,17 |
0,0302 |
0,0589 |
14,1 |
13,83 |
0,27 |
0,0735 |
0,2 |
14,3 |
14,37 |
-0,0717 |
0,00514 |
0,12 |
14,6 |
15,15 |
-0,55 |
0,3 |
0,23 |
15 |
15,22 |
-0,22 |
0,0504 |
0,1 |
15,2 |
15,3 |
-0,1 |
0,0104 |
0,015 |
16,1 |
16,23 |
-0,13 |
0,0175 |
0,000922 |
16,5 |
15,61 |
0,89 |
0,79 |
1,04 |
1,28 |
1,76 |
Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона:
Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 10 и количества объясняющих переменных m=1.
Автокорреляция отсутствует, если выполняется
следующее условие:
d1 < DW
и d2 < DW
< 4 – d2.
Автокорреляция остатков отсутствует, если 1,5 < DW < 2,5.
Поскольку 1,5 > 1,38 < 2,5, то автокорреляция остатков присутствует.