Интегрируемые эконометрические процессы: оценка порядка интегрируемости, тесты на единичный корень

Автор работы: Пользователь скрыл имя, 01 Декабря 2013 в 17:05, контрольная работа

Описание работы

В эконометрике принято моделировать временной ряд как случайный процесс, называемый также стохастическим процессом, под которым понимается статистическое явление, развивающееся во времени согласно законам теории вероятностей. Случайный процесс - это случайная последовательность.
В данной работе были рассмотрены нестационарные стохастические процессы и нестационарные временные ряды, раскрыты основные понятия, рассмотрен Тест Дики-Фуллера и показан на конкретном примере.

Содержание работы

Введение 3
Теоретическая часть 4
1. Нестационарные интегрируемые процессы 4
1.1 Нестационарные стохастические процессы. Нестационарные временные ряды 4
2. Тесты Дики-Фуллера 8
2.1 Модификации теста Дики-Фуллера для случая автокорреляции 9
2.2 Определение единичных корней методом Дики-Фуллера 9
2.3 Метод разностей и интегрируемость 12
2.4 Применение Теста Дики-Фуллера, проверка на стационарность 12
Расчетная часть 19
Задача № 1 19
Задача № 2 25
Заключение 29
Список литературы 30

Файлы: 1 файл

Никитина Е.В. гр.ТБА-1з-222-11.docx

— 251.58 Кб (Скачать файл)

 

Фиктивные переменные DT 2002  и DT 2004 оказались статистически незначимыми и целесообразно исключить их из модели.

Dependent Variable: X1

Method: Least Squares

Date: 10/15/08   Time: 16:12

Sample: 1996:1 2007:1

Included observations: 45

Variable

Coefficient

Std. Error

t-Statistic

Prob. 

@TREND()

317.2297

27.54176

11.51813

0.0000

@SEAS(4)

3607.172

1381.812

2.610465

0.0125

DT2006

-11706.42

4226.652

-2.769667

0.0083

R-squared

0.635981

    Mean dependent var

7138.311

Adjusted R-squared

0.618647

    S.D. dependent var

6595.572

S.E. of regression

4073.016

    Akaike info criterion

19.52650

Sum squared resid

6.97E+08

    Schwarz criterion

19.64694

Log likelihood

-436.3462

    Durbin-Watson stat

0.679681


 

Полученная  модель обладает лучшими характеристиками, чем предыдущая. Проведем графический анализ остатков полученной модели (фактические данные-Actual, смоделированные-Fitted, остатки-Residual). Остатки колеблются около нуля.

Рис.4

Проверим  ряд остатков на стационарность с  помощью расширенного теста Дикки-Фуллера.

ADF Test Statistic

-2.459761

    1%   Critical Value*

-2.6155

   

    5%   Critical Value

-1.9483

   

    10% Critical Value

-1.6197

*MacKinnon critical values for rejection of hypothesis of a unit root.

         
         

Augmented Dickey-Fuller Test Equation

Dependent Variable: D(RESID01)

Method: Least Squares

Date: 10/15/08Time: 16:29

Sample(adjusted): 1996:2 2007:1

Included observations: 44 after adjusting endpoints

Variable

Coefficient

Std. Error

t-Statistic

Prob. 

RESID01(-1)

-0.316537

0.128686

-2.459761

0.0180

R-squared

0.120900

    Mean dependent var

173.2249

Adjusted R-squared

0.120900

    S.D. dependent var

3314.004

S.E. of regression

3107.221

    Akaike info criterion

18.94331

Sum squared resid

4.15E+08

    Schwarz criterion

18.98386

Log likelihood

-415.7528

    Durbin-Watson stat

2.117477


 

Значение  статистики ADF меньше критического на 5% уровне значимости. Можно сделать вывод, что ряд остатков является TS, N.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расчетная часть

Задача № 1

 

Имеются данные по 10 хозяйствам (таблица).

Номер хозяйства

Урожайность, ц/га, у

Внесено удобрений, кг/га, х

1

15

2,1

2

18

3,6

3

17

3,5

4

22

5,0

5

25

6,5

6

20

4,2

7

24

6,3

8

19

4,0

9

23

6,0

10

27

7,5


Задание:

  1. Определите уравнение линейной регрессии и поясните смысл его параметров.
  2. Найдите линейный коэффициент корреляции и детерминации. Поясните их смысл.
  3. С вероятностью 0,95 оцените статистическую значимость уравнения регрессии в целом и его параметров. Постройте таблицу дисперсионного анализа результатов регрессии.
  4. Вычислите среднюю ошибку аппроксимации.
  5. Рассчитайте стандартную ошибку регрессии.
  6. Постройте доверительный интервал для урожайности с вероятностью 0,95 в предположении, что объем внесенных удобрений увеличится на 500 г. от среднего уровня.

 

 

 

 

 

 

Решение:

1.

 

 

 

 

 

 

 

 

 

Рис.1

По расположению эмпирических точек можно предполагать наличие линейной корреляционной (регрессионной) зависимости между переменными  Х и У.

Поэтому уравнение регрессии будем искать в виде линейного уравнения У=b1x+b0

Согласно  методу наименьших квадратов неизвестные  параметры выбираются таким образом, чтобы сумма квадратов отклонений эмпирических значений Уi от значений Утеор, найденных по уравнению регрессии, была минимальной.

Коэффициент b1 называется выборочным коэффициентом регрессии (или просто коэффициентом регрессии) Y по Х. Он показывает, на сколько единиц в среднем изменяется переменная Y при увеличении переменной Х на одну единицу.

Найдём:          

 

 

 

Y=2,266x+9,962 – уравнение регрессии. Можно сделать вывод, что при увеличении внесения удобрений Х на 1 га на один килограмм, урожайность в среднем увеличивается на 2,266 ц (в усл. ед.). Свободный член в данном уравнении не имеет экономического смысла.

2. Найдём  коэффициент корреляции, который  является показателем тесноты  линейной связи по формуле: 

 

 

 

Чем ближе  r к единице, тем теснее связь. У нас связь прямая тесная.

Одной из наиболее эффективных оценок адекватности регрессионной модели, мерой качества уравнения регрессии, (или как  говорят, мерой качества подгонки регрессионной  модели к наблюдённым значениям  yi), характеристикой прогностической силы анализируемой регрессионной модели является коэффициент детерминации, определяемый по формуле в случае парной регрессионной модели:

 

Т. е. коэффициент  детерминации равен квадрату коэффициента корреляции

 

Величина  R2 показывает, какая часть (доля) вариации зависимой переменной (у нас урожайность) обусловлена вариацией (у нас внесение удобрений) объясняющей переменной.

3. Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальными данными и достаточно ли включённых в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.

Проверка  значимости уравнения проводится на основе дисперсионного анализа.

Таблица №1 дисперсионного анализа

Компоненты дисперсии

Сумма квадратов

Число степеней свободы

Средние квадраты

Регрессия

 

m-1=2-1=1

 

Остаточная

 

n-m=10-2=8

 

Общая

 

n-1=10-1=9

 

 

Уравнение регрессии значимо на уровне a, если фактически наблюдаемое значение статистики

 

Где – табличное значение F – критерия Фишера – Снедекора, определяемое на уровне значимости a при k1=m-1=2-1=1 и k2=n-m=10-2=8 (n- объем выборки, m = 2 в случае парной линейной регрессии) степенях свободы. Значение F показывает, в какой мере регрессия лучше оценивает значение зависимой переменной по сравнению с её средней.

 

Так как, Fрасч > Fтабл , то уравнение регрессии в целом значимо.

Значимость  уравнения регрессии может быть проверена и другим способом, если оценить значимость коэффициента регрессии  b1, который имеет t – распределение Стьюдента с k=n-2=10-2=8 степенями свободы.

Уравнение парной регрессии или коэффициент  регрессии b1значимы на уровне a (иначе - гипотеза H0 о равенстве параметра b1 нулю, т.е. H0: b1=0, отвергается), если фактически наблюдаемое значение статистики больше критического (по абсолютной величине), т.е.

 

У нас 

F=t          488    почти равно 22*22=483

Можно оценить  значимость коэффициента корреляции:

 

У нас 

Значит, коэффициент  корреляции значим.

4. Оценку  качества построенной модели (её  точности) даёт также средняя  относительная ошибка аппроксимации  (средняя относительная ошибка  модели), которая рассчитывается  по формуле:

Это означает, что в среднем расчетные значения отличаются от фактических значений на 0,04%.

Так как  =0,04% < 10%, то ошибка считается приемлемой, что говорит о хорошей точности модели.

5. Отклонение (ошибка) исходных данных yi от рассчитанных по модели значений =y(xi) вычисляется по формуле

.

где Sе – среднеквадратическое отклонение выборочных точек от линии регрессии ,

 

6. Осуществим  прогнозирование при a=0,05. Прогнозное значение признака y получается при подстановке в уравнение регрессии соответствующего прогнозного значения факторного признака x:

          Такой прогноз называется точечным. Значение факторного признака xпрог не должно значительно отличаться от входящих в исследуемую выборку (по которой определено уравнение регрессии). Точечный прогноз обычно сопровождают интервальным, поскольку трудно ожидать совпадения в будущем фактического значения y с прог. Интервальный прогноз задается с помощью доверительного интервала: , где U – величина отклонения от линии регрессии.

Доверительный интервал – это интервал, в котором  с заданной вероятностью можно ожидать  появление фактического значения прогнозируемого  показателя.

           Величина U оценивается по формуле:

Находим недостающие  данные для расчета интервального  прогноза. Стандартная ошибка - Se =0,516; рассчитаем с помощью программы Excel - Мастера функций – СТЬЮДРАСПОБР (0,1;8); его значение составит =1,86.

 

В результате имеем точечный прогноз (10,085; 12,105)

Нижняя граница = 11,095 - 1,01 = 10,085

Верхняя граница =11,095 + 1,01 = 12,105

Таким образом, с вероятностью 95% урожайность (Y, ц/га.) при ожидаемых объемах внесения удобрений (X, кг/га.), будет находиться в пределах от 10,085 ц/га. до 12,105 ц/га.

 

 

 

Задача № 2

 

Имеются данные о цене однокомнатной квартиры и величине ее общей площади по 10 сделкам одного района города (таблица):

Таблица №2

№ сделки

1

2

3

4

5

6

7

8

9

10

Цена квартиры, тыс. долл., у

29

31

35

35

45

46

45

44

38

37

Площадь, м2, х

35

35

33

34

38

40

40

39

37

36


Задание:

1.     Постройте уравнение линейной регрессии.

2. Исследуйте гетероскедастичность остатков, построив графики зависимости остатков от значений фактора х и от расчетных значений результата. Примените тест ранговой корреляции Спирмэна с вероятностью 0,95.

Решение:

  1. Найдём:          

 

 

Уравнение регрессии: У=2,13х-39,67

2. Построим  график зависимости остатков  от значений фактора Х и от расчётных значений результата.


 

 

 

 

 

 

 

 

 

 

Рис.2


 

 

 

 

 

 

 

 

 

Рис.3

Использование графического представления позволяет  определиться с наличием гетероскедастичности (отсутствием гомоскедастичности), это проявляется в том, что  разброс остатков меняется в зависимости  от некоторой переменной хi. У нас гетероскедастичность отсутствует, точки расположены хаотично. Теоретические значения Уi не зависимы от остатков.

Информация о работе Интегрируемые эконометрические процессы: оценка порядка интегрируемости, тесты на единичный корень