Автор работы: Пользователь скрыл имя, 01 Декабря 2013 в 17:05, контрольная работа
В эконометрике принято моделировать временной ряд как случайный процесс, называемый также стохастическим процессом, под которым понимается статистическое явление, развивающееся во времени согласно законам теории вероятностей. Случайный процесс - это случайная последовательность.
В данной работе были рассмотрены нестационарные стохастические процессы и нестационарные временные ряды, раскрыты основные понятия, рассмотрен Тест Дики-Фуллера и показан на конкретном примере.
Введение 3
Теоретическая часть 4
1. Нестационарные интегрируемые процессы 4
1.1 Нестационарные стохастические процессы. Нестационарные временные ряды 4
2. Тесты Дики-Фуллера 8
2.1 Модификации теста Дики-Фуллера для случая автокорреляции 9
2.2 Определение единичных корней методом Дики-Фуллера 9
2.3 Метод разностей и интегрируемость 12
2.4 Применение Теста Дики-Фуллера, проверка на стационарность 12
Расчетная часть 19
Задача № 1 19
Задача № 2 25
Заключение 29
Список литературы 30
Фиктивные переменные DT 2002 и DT 2004 оказались статистически незначимыми и целесообразно исключить их из модели.
Dependent Variable: X1 | ||||
Method: Least Squares | ||||
Date: 10/15/08 Time: 16:12 | ||||
Sample: 1996:1 2007:1 | ||||
Included observations: 45 | ||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
@TREND() |
317.2297 |
27.54176 |
11.51813 |
0.0000 |
@SEAS(4) |
3607.172 |
1381.812 |
2.610465 |
0.0125 |
DT2006 |
-11706.42 |
4226.652 |
-2.769667 |
0.0083 |
R-squared |
0.635981 |
Mean dependent var |
7138.311 | |
Adjusted R-squared |
0.618647 |
S.D. dependent var |
6595.572 | |
S.E. of regression |
4073.016 |
Akaike info criterion |
19.52650 | |
Sum squared resid |
6.97E+08 |
Schwarz criterion |
19.64694 | |
Log likelihood |
-436.3462 |
Durbin-Watson stat |
0.679681 |
Полученная модель обладает лучшими характеристиками, чем предыдущая. Проведем графический анализ остатков полученной модели (фактические данные-Actual, смоделированные-Fitted, остатки-Residual). Остатки колеблются около нуля.
Рис.4
Проверим ряд остатков на стационарность с помощью расширенного теста Дикки-Фуллера.
ADF Test Statistic |
-2.459761 |
1% Critical Value* |
-2.6155 | |
5% Critical Value |
-1.9483 | |||
10% Critical Value |
-1.6197 | |||
*MacKinnon critical values for rejection of hypothesis of a unit root. | ||||
Augmented Dickey-Fuller Test Equation | ||||
Dependent Variable: D(RESID01) | ||||
Method: Least Squares | ||||
Date: 10/15/08Time: 16:29 | ||||
Sample(adjusted): 1996:2 2007:1 | ||||
Included observations: 44 after adjusting endpoints | ||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
RESID01(-1) |
-0.316537 |
0.128686 |
-2.459761 |
0.0180 |
R-squared |
0.120900 |
Mean dependent var |
173.2249 | |
Adjusted R-squared |
0.120900 |
S.D. dependent var |
3314.004 | |
S.E. of regression |
3107.221 |
Akaike info criterion |
18.94331 | |
Sum squared resid |
4.15E+08 |
Schwarz criterion |
18.98386 | |
Log likelihood |
-415.7528 |
Durbin-Watson stat |
2.117477 |
Значение статистики ADF меньше критического на 5% уровне значимости. Можно сделать вывод, что ряд остатков является TS, N.
Имеются данные по 10 хозяйствам (таблица).
Номер хозяйства |
Урожайность, ц/га, у |
Внесено удобрений, кг/га, х |
1 |
15 |
2,1 |
2 |
18 |
3,6 |
3 |
17 |
3,5 |
4 |
22 |
5,0 |
5 |
25 |
6,5 |
6 |
20 |
4,2 |
7 |
24 |
6,3 |
8 |
19 |
4,0 |
9 |
23 |
6,0 |
10 |
27 |
7,5 |
Задание:
Решение:
1.
Рис.1
По расположению эмпирических точек можно предполагать наличие линейной корреляционной (регрессионной) зависимости между переменными Х и У.
Поэтому
уравнение регрессии будем
Согласно
методу наименьших квадратов неизвестные
параметры выбираются таким образом,
чтобы сумма квадратов
Коэффициент b1 называется выборочным коэффициентом регрессии (или просто коэффициентом регрессии) Y по Х. Он показывает, на сколько единиц в среднем изменяется переменная Y при увеличении переменной Х на одну единицу.
Найдём:
Y=2,266x+9,962 – уравнение регрессии. Можно сделать вывод, что при увеличении внесения удобрений Х на 1 га на один килограмм, урожайность в среднем увеличивается на 2,266 ц (в усл. ед.). Свободный член в данном уравнении не имеет экономического смысла.
2. Найдём коэффициент корреляции, который является показателем тесноты линейной связи по формуле:
Чем ближе r к единице, тем теснее связь. У нас связь прямая тесная.
Одной из наиболее эффективных оценок адекватности регрессионной модели, мерой качества уравнения регрессии, (или как говорят, мерой качества подгонки регрессионной модели к наблюдённым значениям yi), характеристикой прогностической силы анализируемой регрессионной модели является коэффициент детерминации, определяемый по формуле в случае парной регрессионной модели:
Т. е. коэффициент детерминации равен квадрату коэффициента корреляции
Величина R2 показывает, какая часть (доля) вариации зависимой переменной (у нас урожайность) обусловлена вариацией (у нас внесение удобрений) объясняющей переменной.
3. Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальными данными и достаточно ли включённых в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.
Проверка значимости уравнения проводится на основе дисперсионного анализа.
Таблица №1 дисперсионного анализа
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Средние квадраты |
Регрессия |
m-1=2-1=1 |
||
Остаточная |
n-m=10-2=8 |
||
Общая |
n-1=10-1=9 |
Уравнение регрессии значимо на уровне a, если фактически наблюдаемое значение статистики
Где – табличное значение F – критерия Фишера – Снедекора, определяемое на уровне значимости a при k1=m-1=2-1=1 и k2=n-m=10-2=8 (n- объем выборки, m = 2 в случае парной линейной регрессии) степенях свободы. Значение F показывает, в какой мере регрессия лучше оценивает значение зависимой переменной по сравнению с её средней.
Так как, Fрасч > Fтабл , то уравнение регрессии в целом значимо.
Значимость уравнения регрессии может быть проверена и другим способом, если оценить значимость коэффициента регрессии b1, который имеет t – распределение Стьюдента с k=n-2=10-2=8 степенями свободы.
Уравнение парной регрессии или коэффициент регрессии b1значимы на уровне a (иначе - гипотеза H0 о равенстве параметра b1 нулю, т.е. H0: b1=0, отвергается), если фактически наблюдаемое значение статистики больше критического (по абсолютной величине), т.е.
У нас
F=t2 488 почти равно 22*22=483
Можно оценить значимость коэффициента корреляции:
У нас
Значит, коэффициент корреляции значим.
4. Оценку
качества построенной модели (её
точности) даёт также средняя
относительная ошибка
Это означает,
что в среднем расчетные
Так как =0,04% < 10%, то ошибка считается приемлемой, что говорит о хорошей точности модели.
5. Отклонение (ошибка) исходных данных yi от рассчитанных по модели значений =y(xi) вычисляется по формуле
.
где Sе – среднеквадратическое отклонение выборочных точек от линии регрессии ,
6. Осуществим прогнозирование при a=0,05. Прогнозное значение признака y получается при подстановке в уравнение регрессии соответствующего прогнозного значения факторного признака x:
Такой прогноз называется точечным. Значение факторного признака xпрог не должно значительно отличаться от входящих в исследуемую выборку (по которой определено уравнение регрессии). Точечный прогноз обычно сопровождают интервальным, поскольку трудно ожидать совпадения в будущем фактического значения y с прог. Интервальный прогноз задается с помощью доверительного интервала: , где U – величина отклонения от линии регрессии.
Доверительный интервал – это интервал, в котором с заданной вероятностью можно ожидать появление фактического значения прогнозируемого показателя.
Величина U оценивается по формуле:
Находим недостающие данные для расчета интервального прогноза. Стандартная ошибка - Se =0,516; рассчитаем с помощью программы Excel - Мастера функций – СТЬЮДРАСПОБР (0,1;8); его значение составит =1,86.
В результате имеем точечный прогноз (10,085; 12,105)
Нижняя граница = 11,095 - 1,01 = 10,085
Верхняя граница =11,095 + 1,01 = 12,105
Таким образом, с вероятностью 95% урожайность (Y, ц/га.) при ожидаемых объемах внесения удобрений (X, кг/га.), будет находиться в пределах от 10,085 ц/га. до 12,105 ц/га.
Имеются данные о цене однокомнатной квартиры и величине ее общей площади по 10 сделкам одного района города (таблица):
Таблица №2
№ сделки |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Цена квартиры, тыс. долл., у |
29 |
31 |
35 |
35 |
45 |
46 |
45 |
44 |
38 |
37 |
Площадь, м2, х |
35 |
35 |
33 |
34 |
38 |
40 |
40 |
39 |
37 |
36 |
Задание:
1. Постройте уравнение линейной регрессии.
2. Исследуйте гетероскедастичность остатков, построив графики зависимости остатков от значений фактора х и от расчетных значений результата. Примените тест ранговой корреляции Спирмэна с вероятностью 0,95.
Решение:
Уравнение регрессии: У=2,13х-39,67
2. Построим график зависимости остатков от значений фактора Х и от расчётных значений результата.
Рис.2
Рис.3
Использование
графического представления позволяет
определиться с наличием гетероскедастичности
(отсутствием