Автор работы: Пользователь скрыл имя, 06 Мая 2013 в 00:30, контрольная работа
Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Рассчитайте параметры линейной парной регрессии для каждого фактора Х, наиболее тесно связанного с Y .
Оцените качество модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера.
Для выбранной модели осуществите прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора составит 80% от его максимального значения. Представьте графически: фактические и модельные значения, точки прогноза.
Вычисления провести с тремя знаками в дробной части. Основные промежуточные результаты вычислений представить в таблицах (при использовании компьютера представить соответствующие листинги с комментариями).
Решение Задачи 2
Для решения данной задачи скопируем исходные данные в Excel.
1. Выявление аномальных наблюдений
Выявление аномальных наблюдений является обязательной процедурой этапа предварительного анализа данных. Так как наличие аномальных наблюдений приводит к искажению результатов моделирования, то необходимо убедиться в отсутствии аномальных наблюдений. Для диагностики аномальных наблюдений воспользуемся методом Ирвина. Для всех наблюдений вычисляем величину λt:
,
где - стандартное отклонение y.
Стандартное отклонение можно рассчитать в Excel с помощью функции СТАНДАРТОТКЛ: = 7.293.
Для расчета используется функция ЗНАК, которая возвращает знак числа (1 – положительное число, -1 – отрицательное число), таким образом, может применяться для расчетов с модулем.
Таблица 2.2
Вспомогательная таблица для выявления аномальных наблюдений.
t |
||||
1 |
43 |
– |
– |
– |
2 |
47 |
4 |
4 |
0.548 |
3 |
50 |
3 |
3 |
0.411 |
4 |
48 |
-2 |
2 |
0.274 |
5 |
54 |
6 |
6 |
0.823 |
6 |
57 |
3 |
3 |
0.411 |
7 |
61 |
4 |
4 |
0.548 |
8 |
59 |
-2 |
2 |
0.274 |
9 |
65 |
6 |
6 |
0.823 |
при значимости P = 0,95. Из расчетов, приведенных в таблице, очевидно, что все значения меньше, то есть аномальные наблюдения отсутствуют. Этот вывод подтверждает графическое представление временного ряда (рис. 2.1).
Рисунок 2.1. Графическое представление временного ряда.
Коэффициенты линейной модели регрессии с использованием инструмента Регрессия в Excel, результаты которого представлены в таблице 2.3.
Таблица 2.3
Результаты регрессионного анализа
Регрессионная статистика | |
Множественный R |
0.970014 |
R-квадрат |
0.940927 |
Нормированный R-квадрат |
0.932488 |
Стандартная ошибка |
1.895065 |
Наблюдения |
9 |
Дисперсионный анализ | ||||||||
df |
SS |
MS |
F |
Значимость F | ||||
Регрессия |
1 |
400.4167 |
400.4166667 |
111.4972376 |
1.4929E-05 | |||
Остаток |
7 |
25.13889 |
3.591269841 |
|||||
Итого |
8 |
425.5556 |
||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |||||
y-пересечение |
40.86111 |
1.376733 |
29.67977489 |
1.27015E-08 | ||||
t |
2.583333 |
0.244652 |
10.55922524 |
1.4929E-05 |
Модель временного ряда для изменения спроса можно записать в следующем виде: .
3. Оценка адекватность построенной модели с использованием свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения.
Суть критерия адекватности заключается в проверке остаточной компоненты ряду статистических гипотез.
1) Математическое ожидание значения остаточной компоненты равно 0.
Данная гипотеза выполняется всегда при расчете параметров МНК.
2) Проверку случайности уровней ряда остатков.
Проверка проводится на основе метода поворотных точек.
Значение случайной переменной считается поворотной точкой, если оно одновременно больше (меньше) соседних с ним элементов. Поворотные точки отмечены в таблице 2.4 (окрашенные ячейки) и на графике остаточной компоненты (рис. 2.2).
Рисунок 2.2. Графическое изображение ряда остаточной компоненты.
Таким образом, при количестве наблюдений n = 9 число поворотных точек p = 4. Следовательно, выполняется неравенство:
Данная гипотеза верна и построенная модель адекватна данному процессу.
3) Проверка независимости (отсутствия автокорреляции) последовательных значений остаточной компоненты.
Данная гипотеза проверяется с помощью d-критерия Дарбина-Уотсона (определяется отсутствие в ряде остатков систематической составляющей):
.
Для расчета d используется таблица остатков, полученная в результате регрессионного анализа.
Таблица 2.4
Вспомогательная таблица для проверки независимости последовательных значений остаточного ряда
t |
|||||
1 |
43.444 |
-0.444 |
0.198 |
– |
– |
2 |
46.028 |
0.972 |
0.945 |
2.007 |
-0.432 |
3 |
48.611 |
1.389 |
1.929 |
0.174 |
1.350 |
4 |
51.194 |
-3.194 |
10.204 |
21.007 |
-4.437 |
5 |
53.778 |
0.222 |
0.049 |
11.674 |
-0.710 |
6 |
56.361 |
0.639 |
0.408 |
0.174 |
0.142 |
7 |
58.944 |
2.056 |
4.225 |
2.007 |
1.313 |
8 |
61.528 |
-2.528 |
6.390 |
21,007 |
-5.196 |
9 |
64.111 |
0.889 |
0.790 |
11.674 |
-2.247 |
Итого: |
25.139 |
69.722 |
-10.216 |
Таким образом, .
Рассчитанное значение d сравнивается с нижним d1 и верхним d2 критическими значениями. Значения этих границ (даны в специальных таблицах) при уровне значимости α=0.05, числе наблюдений n=9 и количестве факторов k=1 составляют: d1=0.82 и d2=1.32.
, .
Это означает, что между значениями имеет место обратная зависимость. Вычисляется значение , которое вновь сравнивают с нижним d1 и верхним d2 критическими значениями: .
Это означает, что по данной гипотезе нельзя сделать окончательного вывода, необходима дополнительная проверка. Она может быть осуществлена путем расчета коэффициента автокорреляции первого порядка:
.
Значение рассчитывается в Excel (табл. 2.4). Полученное значение коэффициента автокорреляции сравнивается с табличным значением для 5-% уровня значимости (вероятности допустить ошибку при принятии нулевой гипотезы о независимости уровней ряда) r(1)табл=0.36: , .
Это означает, что гипотеза отвергается, модель неадекватна.
4) Соответствие ряда остатков нормальному закону распределения. Проверка осуществляется с помощью RS-критерия:
, (14)
где и - соответственно максимальный и минимальный уровень ряда остатков; - среднеквадратическое отклонение ряда остатков.
Максимальное и минимальное значения остаточной компоненты вычисляются в Excel с помощью функций МАКС и МИН, а среднеквадратическое отклонение ряда остатков – с помощью функции СТАНДОТКЛОН:
= -3.194, = 2.056 и S = 1.773.
Следовательно, RSрасч=2.962.
Рассчитанное значение RS-критерия сравнивается с табличными значениями (по условию задачи RSнижн=2.7 и RSверх=3.7):
Так как расчетное значение RS попадает между табличными, то гипотеза о нормальном распределении ряда остатков принимается и модель по данному критерию адекватна.
Вывод: Модель адекватна по критериям случайности последовательных значений ряда остатков и RS-критерию, но неадекватна по d-критерию Дарбина-Уотсона.
4. Оценка точность моделей на основе использования средней относительной ошибки аппроксимации.
Для оценки точности модели определяется средняя ошибка аппроксимации по формуле [6] (аналогично пункту 4 Задачи 1). При расчете используется таблица остатков, полученная при регрессионном анализе.
Таблица 2.5
Вспомогательная таблица для расчета средней ошибки аппроксимации
Наблюдение |
Остатки, εi (t) |
||
1 |
-0.444 |
43 |
0.026 |
2 |
0.972 |
47 |
0.052 |
3 |
1.389 |
50 |
0.069 |
4 |
-3.194 |
48 |
0.166 |
5 |
0.222 |
54 |
0.010 |
6 |
0.639 |
57 |
0.028 |
7 |
2.056 |
61 |
0.084 |
8 |
-2.528 |
59 |
0.107 |
9 |
0.889 |
65 |
0.034 |
Итого: |
0.577 |
Вывод: Средней относительная ошибка аппроксимации = 0.577, что свидетельствует о том, что модель точная.
5. Прогноз
спроса на следующие две недели
(доверительный интервал
Для вычисления точечного прогноза в построенную модель подставляются в ранее полученное уравнение регрессии соответствующие значения фактора t=n+l (l – число шагов прогноза). Для 10 и 11 недели:
ŷ10=40.861+2.583∙10 ≈ 66.694 (тыс. долл.),
ŷ11=40.861+2.583∙11≈69.278 (тыс. долл.).
Для построения интервального прогноза рассчитаем доверительный интервал , где .
Величину стандартной ошибки можно найти в таблице 2.3, =1.895.
Значение t-критерия Стьюдента ( ) рассчитывается с учетом заданного уровня значимости (α=0.3) и числа степеней свободы (n-l-1)=7 с помощью функции СТЬЮДРАПОБР: 1.119. Значение вычисляется с помощью Excel и составляет 60.
Таким образом, ,
Далее вычисляем верхнюю и нижнюю границы: