Основные модели, используемые при анализе временных рядов

Автор работы: Пользователь скрыл имя, 07 Января 2015 в 16:42, курсовая работа

Описание работы

Почти в каждой области встречаются явления, которые интересно и важно изучать в их развитии и изменении во времени. В повседневной жизни могут представлять интерес, например, метеорологические условия, цены на тот или иной товар, те или иные характеристики состояния здоровья индивидуума и т. д. Все они изменяются во времени. С течением времени изменяются деловая активность, режим протекания того или иного производственного процесса, глубина сна человека, восприятие телевизионной программы.

Файлы: 1 файл

rehc.docx

— 98.21 Кб (Скачать файл)

Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.

R2= -0.742 = 0.5413

т.е. в 54.13 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - средняя. Остальные 45.87 % изменения Y объясняются факторами, не учтенными в модели.

Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)

 

 

x

y

y(x)

(yi-ycp)2

(y-y(x))2

(xi-xcp)2

|y - yx|:y

139

1

-2.28

55.75

10.78

967.21

3.28

117

23

5.32

211.22

312.54

82.81

0.77

151

-6

-6.43

209.28

0.19

1857.61

0

181

-21

-16.8

868.28

17.64

5343.61

0

70

28

21.57

381.55

41.39

1436.41

0.23

99

15

11.54

42.68

11.95

79.21

0.23

22

23

38.16

211.22

229.76

7378.81

0.66

81

18

17.76

90.88

0.0554

723.61

0.0131

120

7

4.28

2.15

7.37

146.41

0.39

115

7

6.01

2.15

0.98

50.41

0.14

161

11

-9.89

6.42

436.28

2819.61

1.9

171

-26

-13.34

1187.95

160.18

3981.61

0

209

-106

-26.48

13102.62

6323.67

10221.21

0

168

-4

-12.31

155.42

69

3612.01

0

140

0

-2.63

71.68

6.91

1030.41

0

10

31

42.31

507.75

127.82

9584.41

0.36

140

0

-2.63

71.68

6.91

1030.41

0

69

29

21.91

421.62

50.23

1513.21

0.24

-16

35

51.29

704.02

265.45

15351.21

0.47

87

26

15.69

307.42

106.28

436.81

0.4

162

-2

-10.23

109.55

67.78

2926.81

0

161

11

-9.89

6.42

436.28

2819.61

1.9

120

22

4.28

183.15

313.85

146.41

0.81

70

29

21.57

421.62

55.25

1436.41

0.26

120

6

4.28

6.08

2.94

146.41

0.29

90

17

14.65

72.82

5.5

320.41

0.14

10

32

42.31

553.82

106.21

9584.41

0.32

30

24

35.39

241.28

129.79

6068.41

0.47

90

25

14.65

273.35

107.04

320.41

0.41

150

-1

-6.09

89.62

25.86

1772.41

0

3237

254

254

20569.47

9435.9

93188.7

13.68


 

 

 

2. Оценка параметров уравнения  регрессии.

2.1. Значимость коэффициента  корреляции.

Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия

tнабл = rxy n-2;1 - r2xy

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл<tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| >tкрит — нулевую гипотезу отвергают.

tнабл = 0.74 28;1 - 0.742 = 7.57

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=28 находим tкрит:

tкрит (n-m-1;α/2) = (28;0.025) = 2.048

где m = 1 - количество объясняющих переменных.

Если tнабл>tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).

Поскольку tнабл>tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим

В парной линейной регрессии t2r = t2b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.

2.2. Интервальная оценка  для коэффициента корреляции (доверительный  интервал).

r - tкрит 1-r2;n; r + tкрит 1-r2;n

Доверительный интервал для коэффициента корреляции

0.74 - 2.0481-0.742;30; 0.74 + 2.0481-0.742;30

r(-0.91;-0.56)

2.3. Анализ точности определения  оценок коэффициентов регрессии.

Несмещенной оценкой дисперсии возмущений является величина:

S2y = ∑yi - yx2;n - m - 1

S2y = 9435.9;28 = 337

S2y = 337 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).

Sy  = S2y  = 337 = 18.36

Sy = 18.36 - стандартная ошибка оценки (стандартная ошибка регрессии).

Sa - стандартное отклонение случайной величины a.

Sa = Sy   ∑x2;n Sx

Sa = 18.36  442461;30 • 55.73 = 7.3

Sb - стандартное отклонение случайной величины b.

Sb =  Sy; n Sx

Sb =  18.36; 30 • 55.73 = 0.0601

2.4. Доверительные интервалы  для зависимой переменной.

Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов.

Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.

(a + bxp ± ε)

где

ε = tкрит Sy 1;n + x-x p2;∑xi - x2

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 110

ε = 2.048 • 18.36 1;30 + 107.9 - 1102;93188.7 = 6.87

(45.76 -0.35*110 ± 6.87)

(0.87;14.61)

С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

Индивидуальные доверительные интервалы для Y при данном значении X.

(a + bxi ± ε)

где

ε = tкрит Sy 1 + 1;n + ∑x-xi2;∑xi - x2

ε = 2.048 • 18.36 1 + 1;30 + 107.9 - xi2;93188.7

tкрит (n-m-1;α/2) = (28;0.025) = 2.048

 

 

xi

y = 45.76 -0.35xi

εi

ymin = y - εi

ymax = y + εi

139

-2.28

38.41

-40.69

36.13

117

5.32

38.23

-32.91

43.56

151

-6.43

38.58

-45.02

32.15

181

-16.8

39.26

-56.06

22.46

70

21.57

38.5

-16.93

60.07

99

11.54

38.23

-26.69

49.78

22

38.16

39.65

-1.5

77.81

81

17.76

38.36

-20.6

56.13

120

4.28

38.25

-33.96

42.53

115

6.01

38.23

-32.21

44.24

161

-9.89

38.77

-48.66

28.89

171

-13.34

39

-52.34

25.66

209

-26.48

40.19

-66.67

13.72

168

-12.31

38.93

-51.23

26.62

140

-2.63

38.42

-41.05

35.79

10

42.31

40.07

2.23

82.38

140

-2.63

38.42

-41.05

35.79

69

21.91

38.52

-16.6

60.43

-16

51.29

41.15

10.14

92.44

87

15.69

38.3

-22.61

53.99

162

-10.23

38.79

-49.03

28.56

161

-9.89

38.77

-48.66

28.89

120

4.28

38.25

-33.96

42.53

70

21.57

38.5

-16.93

60.07

120

4.28

38.25

-33.96

42.53

90

14.65

38.28

-23.63

52.93

10

42.31

40.07

2.23

82.38

30

35.39

39.4

-4.01

74.8

90

14.65

38.28

-23.63

52.93


 

 

 

С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

2.5. Проверка гипотез относительно  коэффициентов линейного уравнения  регрессии.

1) t-статистика. Критерий  Стьюдента.

С помощью МНК мы получили лишь оценки параметров уравнения регрессии, которые характерны для конкретного статистического наблюдения (конкретного набора значений x и y).

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.

Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности используют статистические методы проверки гипотез.

В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля  параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.

В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.

Найденное по данным наблюдений значение  t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике или эконометрике).

Табличное значение определяется в зависимости от уровня значимости (α) и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2), n-число наблюдений.

Если фактическое значение  t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-α) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.

Если фактическое значение  t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости α.

tкрит (n-m-1;α/2) = (28;0.025) = 2.048

tb = b;Sb

tb = -0.35;0.0601 = 5.75

Поскольку 5.75  >  2.048, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

ta = a;Sa

ta = 45.76;7.3 = 6.27

Поскольку 6.27  >  2.048, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

Доверительный интервал для коэффициентов уравнения регрессии.

Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95%  будут следующими:

(b - tкритSb; b + tкритSb)

(-0.35 - 2.048 • 0.0601; -0.35 + 2.048 • 0.0601)

(-0.47;-0.22)

С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

(a - tкритSa; a + tкрит Sa)

(45.76 - 2.048 • 7.3; 45.76 + 2.048 • 7.3)

(30.81;60.72)

С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

2) F-статистика. Критерий  Фишера.

Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.

Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.

Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.

R2 = 1 - ∑yi - yx2; ∑yi - y2 = 1 - 9435.9;20569.47 = 0.5413

где m – число факторов в модели.

Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:

1. Выдвигается нулевая  гипотеза о том, что уравнение  в целом статистически незначимо: H0: R2=0 на уровне значимости α.

2. Далее определяют фактическое  значение F-критерия:

F = R2;1 - R2n - m -1;m

F = 0.5413;1 - 0.541330-1-1;1 = 33.04

где m=1 для парной регрессии.

3. Табличное значение  определяется по таблицам распределения  Фишера для заданного уровня  значимости, принимая во внимание, что число степеней свободы  для общей суммы квадратов (большей  дисперсии) равно 1 и число степеней  свободы остаточной суммы квадратов (меньшей дисперсии) при линейной  регрессии равно n-2.

Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α. Уровень значимости α - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05 или 0,01.

4. Если фактическое значение F-критерия меньше табличного, то  говорят, что нет основания отклонять  нулевую гипотезу.

В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.

Табличное значение критерия со степенями свободы k1=1 и k2=28, Fтабл = 4.2

Информация о работе Основные модели, используемые при анализе временных рядов