Модель простой регрессии

Автор работы: Пользователь скрыл имя, 12 Марта 2016 в 11:51, контрольная работа

Описание работы

Математические модели широко используются в экономике, в финансах, в общественных науках. Обычно модели строятся и верифицируются на основе имеющихся наблюдений изучаемого показателя и, так называемых, объясняющих факторов. Язык экономики все больше становится математическим, а саму экономику все чаще упоминают как одну из наиболее математизированных наук. В течение последних десятилетий математические и, в частности, статистические методы в экономике стремительно развиваются. Свидетельством признания эконометрики является присуждение за наиболее выдающиеся работы в этой области Нобелевских премий по экономике: Р.Фришу и Я. Тинбергу (1969) за разработку математических методов анализа экономических процессов, Л. Клейну (1980) за создание эконометрических моделей и их применение к анализу экономических колебаний и экономической политике, Т. Хаавельмо (1989) за работы в области вероятностных основ эконометрики и анализ одновременных экономических структур, Дж. Хекману и Д. Макфаддену (2000) за развитие методов анализа селективных выборок и моделей дискретного выбора.

Файлы: 1 файл

Kursovaya_Model_prostoy_regressii_116529.doc

— 1.05 Мб (Скачать файл)

EQ η = \r(\f(54852.006;229104.81)) = 0.489

где

EQ (\x\to(y) - y) = 229104.81 - 174252.81 = 54852.006

Индекс корреляции.

Для линейной регрессии индекс корреляции равен коэффициенту корреляции rxy = 0.489.

Полученная величина свидетельствует о том, что фактор x умеренно влияет на y

Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:

EQ R = \r(1 - \f(∑ix2; ∑i2) )

Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy.

В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].

Теоретическое корреляционное отношение для линейной связи равно коэффициенту корреляции rxy.

1.6. Коэффициент детерминации.

Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака.

Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.

R2= 0.4892 = 0.2394

т.е. в 23.94 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - низкая. Остальные 76.06 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)

 

 

x

y

y(x)

(yi-ycp)2

(y-y(x))2

(xi-xcp)2

|y - yx|:y

10

-31.6

-3.69

2244.94

779.14

25.68

0

12.7

33.3

6.69

306.92

708.34

5.61

0.8

18

10

27.05

33.42

290.55

8.6

1.7

14.5

-16.9

13.6

1068.04

930.25

0.32

0

11

0

0.15

249.03

0.0239

16.55

0

8.3

-13.5

-10.22

857.37

10.77

45.8

0

11.2

-15.8

0.92

997.35

279.66

14.96

0

16.8

22.2

22.44

41.21

0.0555

3

0.0106

10

-80.3

-3.69

9231.52

5869.57

25.68

0

14.7

14.2

14.37

2.5

0.0283

0.14

0.0119

15.6

35.2

17.83

377.11

301.86

0.28

0.49

9.2

1.6

-6.76

201.1

69.89

34.43

5.23

12.5

3.6

5.92

148.37

5.37

6.59

0.64

8.8

-22.2

-8.3

1442.54

193.3

39.28

0

14.9

64.6

15.14

2383.31

2446.62

0.0281

0.77

10.8

-24.9

-0.61

1654.93

589.83

18.21

0

7.9

-44

-11.75

3573.75

1039.79

51.38

0

23

4.2

46.25

134.12

1768.47

62.92

10.01

10.7

6.8

-1

80.65

60.81

19.08

1.15

21.8

26.8

41.64

121.42

220.32

45.32

0.55

14

18.5

11.68

7.39

46.52

1.14

0.37

18.6

-6.6

29.35

500.9

1292.43

12.48

0

13

-2.4

7.84

330.54

104.81

4.28

0

11.3

-34.7

1.31

2548.31

1296.51

14.2

0

13.5

-7.1

9.76

523.53

284.21

2.46

0

9.7

-21.7

-4.84

1404.81

284.28

28.81

0

12.1

4

4.38

138.79

0.14

8.81

0.0951

13.2

76.9

8.61

3735.56

4664.06

3.49

0.89

10.2

20.4

-2.92

21.34

543.76

23.69

1.14

23.8

190.3

49.33

30456.95

19873.55

76.25

0.74

12.1

-34.8

4.38

2558.42

1535.1

8.81

0

32.2

88.6

81.6

5302.63

49.06

293.52

0.0791

16.3

-17.6

20.51

1114.28

1452.74

1.52

0

3.7

-36.7

-27.89

2754.24

77.64

129.22

0

19.6

132.4

33.19

13600.04

9842.24

20.54

0.75

15.3

13.2

16.67

6.66

12.06

0.054

0.26

13.3

186.1

8.99

29008.63

31367.88

3.12

0.95

14

-14.1

11.68

892.86

664.57

1.14

0

13.9

2.6

11.3

173.73

75.61

1.36

3.34

9.2

0.7

-6.76

227.43

55.65

34.43

10.66

15.5

-40.7

17.44

3190.08

3380.45

0.19

0

7.7

-40

-12.52

3111.5

755.02

54.28

0

20

53.1

34.73

1392.72

337.51

24.33

0.35

25.9

38.4

57.39

511.63

360.76

117.34

0.49

14.9

32.8

15.14

289.65

311.99

0.0281

0.54

17.4

20.7

24.74

24.2

16.33

5.44

0.2

10.9

-1

-0.23

281.6

0.59

17.37

0

36

51.6

96.19

1283.01

1988.56

438.16

0.86

8.3

-5.6

-10.22

457.14

21.32

45.8

0

21.7

-4.6

41.26

415.38

2103.06

43.99

0

23.3

76.4

47.41

3674.69

840.67

67.77

0.38

9.5

-22.4

-5.61

1457.77

281.98

31

0

5.5

-33.3

-20.97

2408.93

151.93

91.54

0

14

135.8

11.68

14404.61

15405.95

1.14

0.91

24.5

62.8

52.02

2210.8

116.31

88.97

0.17

10.3

-5

-2.53

431.84

6.08

22.73

0

12.1

15.4

4.38

0.15

121.43

8.81

0.72

16.8

38.1

22.44

498.15

245.37

3

0.41

6.8

-23.7

-15.98

1558.73

59.6

68.35

0

13.6

-21.9

10.14

1419.84

1026.73

2.15

0

19.4

-7.7

32.42

551.35

1609.91

18.77

0

22.9

22.1

45.87

39.93

564.97

61.35

1.08

14

-24.3

11.68

1606.47

1294.51

1.14

0

10.1

-21.5

-3.3

1389.86

331.14

24.68

0

8.6

11.7

-9.07

16.65

431.19

41.83

1.77

12.4

1.8

5.53

195.46

13.93

7.12

2.07

13.2

-44.8

8.61

3670.03

2852.21

3.49

0

22

7.1

42.41

75.36

1246.91

48.06

4.97

20.8

127.2

37.8

12414.24

7992.04

32.86

0.7

26.5

14.6

59.7

1.39

2033.88

130.7

3.09

15.8

-5.4

18.59

448.63

575.71

0.54

0

21

52.9

38.57

1377.83

205.35

35.19

0.27

18.4

5.3

28.58

109.85

542.06

11.1

4.39

15.5

101.3

17.44

7313.53

7032.23

0.19

0.83

14

-0.6

11.68

268.33

150.78

1.14

0

16.7

-23.4

22.05

1535.14

2065.83

2.66

0

9.1

-4.2

-7.14

399.23

8.67

35.61

0

13.3

70.5

8.99

2994.19

3783.46

3.12

0.87

17.2

37.3

23.97

463.08

177.63

4.55

0.36

5.4

-43.7

-21.36

3537.97

499.16

93.46

0

12

-4.1

4

395.25

65.55

9.41

0

15.7

2.2

18.21

184.44

256.32

0.4

7.28

23

44.4

46.25

819.06

3.43

62.92

0.0417

10.1

-30.9

-3.3

2179.1

761.61

24.68

0

30.3

123.2

74.3

11538.88

2391.55

232.02

0.4

24.3

47.9

51.25

1031.64

11.2

85.24

0.0699

14.5

20.1

13.6

18.66

42.25

0.32

0.32

21.6

7

40.88

77.1

1147.52

42.67

4.84

32.5

9.4

82.75

40.71

5379.91

303.89

7.8

12.2

36

4.76

408.82

975.66

8.22

0.87

16.3

50.7

20.51

1219.35

911.14

1.52

0.6

9

25.7

-7.53

98.39

1104.13

36.82

1.29

15.9

65.2

18.98

2442.26

2136.45

0.69

0.71

9.1

-12.5

-7.14

799.8

28.68

35.61

0

18.4

-1.3

28.58

291.75

892.94

11.1

0

9.7

-27

-4.84

1830.2

491.09

28.81

0

13.9

31.1

11.3

234.68

392.23

1.36

0.64

8.9

-41.1

-7.91

3235.43

1101.4

38.04

0

11.9

81.9

3.61

4371.75

6129.01

10.03

0.96

1491.7

1562.3

1562.3

229104.81

174252.81

3716.9

91.9


 

 

2. Оценка параметров уравнения  регрессии.

2.1. Значимость коэффициента корреляции.

Выдвигаем гипотезы:

H0: rxy = 0, нет линейной взаимосвязи между переменными;

H1: rxy ≠ 0, есть линейная взаимосвязь между переменными;

Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия (величина случайной ошибки)

EQ t = r \f(\r(n-2);\r(1 - r))

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит — нулевую гипотезу отвергают.

EQ t = 0.489 \f(\r(97);\r(1 - 0.489)) = 5.53

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=97 находим tкрит:

tкрит (n-m-1;α/2) = (97;0.025) = 1.984

где m = 1 - количество объясняющих переменных.

Если |tнабл| > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).

Поскольку |tнабл| > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим

Отметим значения на числовой оси.

 

 

Принятие H0

Отклонение H0, принятие H1

95%

5%

1.984

5.53


 

 

В парной линейной регрессии t2r = t2b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.

2.2. Интервальная оценка для коэффициента  корреляции (доверительный интервал).

EQ (r - t \r(\f(1-r;n-2)); r + t \r(\f(1-r;n-2)))

Доверительный интервал для коэффициента корреляции.

EQ (0.489 - 1.984\r(\f(1-0.489;99-2)); 0.489 + 1.984\r(\f(1-0.489;99-2)))

r(0.314;0.665)

2.3. Анализ точности определения  оценок коэффициентов регрессии.

Несмещенной оценкой дисперсии возмущений является величина:

EQ S = \f(∑ix2;n - m - 1)

EQ S = \f(174252.81;97) = 1796.421

S2 = 1796.421 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).

EQ S  = \r(S) = \r(1796.421) = 42.38

S = 42.38 - стандартная ошибка  оценки (стандартная ошибка регрессии).

Sa - стандартное отклонение случайной величины a.

EQ S = S \f(\r( ∑2);n S(x))

EQ S = 42.38 \f( \r(26193.35);99 • 6.127) = 11.31

Sb - стандартное отклонение случайной величины b.

EQ S = \f(S;\r(n) S(x))

EQ S = \f( 42.38; \r(99) • 6.127) = 0.7

2.4. Доверительные интервалы для  зависимой переменной.

Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов.

Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.

(a + bxp ± ε)

где

EQ ε = t S \r(\f(1;n) + \f((\x\to(x)-x);∑i2))

tкрит (n-m-1;α/2) = (97;0.025) = 1.984

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 17

Вычислим ошибку прогноза для уравнения y = bx + a

EQ ε = 1.984 • 42.384 \r(\f(1;99) + \f((15.07 - 17);3716.9)) = 8.862

y(17) = 3.842*17 -42.102 = 23.204

23.204 ± 8.862

(14.34;32.07)

С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

Вычислим ошибку прогноза для уравнения y = bx + a + ε

EQ ε = t S \r(1 + \f(1;n) + \f((\x\to(x)-x);∑i2))

EQ ε = 1.984 • 42.384 \r(1 + \f(1;99) + \f((15.07 - 17);3716.9)) = 84.56

(-61.35;107.76)

Индивидуальные доверительные интервалы для Y при данном значении X.

(a + bxi ± ε)

где

EQ ε = t S \r(1 + \f(1;n) + \f((\x\to(x)-x);∑i2 ))

EQ ε = 1.984 • 42.38 \r(1 + \f(1;99) + \f((15.07 - x);3716.9))

tкрит (n-m-1;α/2) = (97;0.025) = 1.984

 

 

xi

y = -42.1 + 3.84xi

εi

ymin = y - εi

ymax = y + εi

10

-3.69

84.8

-88.49

81.12

12.7

6.69

84.58

-77.89

91.26

18

27.05

84.61

-57.57

111.66

14.5

13.6

84.52

-70.92

98.12

11

0.15

84.7

-84.55

84.85

8.3

-10.22

85.03

-95.25

74.81

11.2

0.92

84.68

-83.76

85.61

16.8

22.44

84.55

-62.11

106.98

10

-3.69

84.8

-88.49

81.12

14.7

14.37

84.52

-70.15

98.88

15.6

17.83

84.52

-66.69

102.34

9.2

-6.76

84.9

-91.66

78.14

12.5

5.92

84.59

-78.67

90.51

8.8

-8.3

84.95

-93.25

76.66

14.9

15.14

84.51

-69.38

99.65

10.8

-0.61

84.72

-85.33

84.1

7.9

-11.75

85.09

-96.84

73.34

23

46.25

85.22

-38.97

131.47

10.7

-1

84.73

-85.73

83.73

21.8

41.64

85.02

-43.38

126.67

14

11.68

84.53

-72.85

96.21

18.6

29.35

84.65

-55.3

114

13

7.84

84.56

-76.72

92.4

11.3

1.31

84.67

-83.37

85.98

13.5

9.76

84.54

-74.78

94.3

9.7

-4.84

84.84

-89.68

80

12.1

4.38

84.61

-80.23

88.99

13.2

8.61

84.55

-75.95

93.16

10.2

-2.92

84.78

-87.7

81.86

23.8

49.33

85.37

-36.04

134.69

12.1

4.38

84.61

-80.23

88.99

32.2

81.6

87.76

-6.16

169.35

16.3

20.51

84.53

-64.02

105.05

3.7

-27.89

85.96

-113.84

58.07

19.6

33.19

84.74

-51.55

117.94

15.3

16.67

84.51

-67.84

101.19

13.3

8.99

84.55

-75.56

93.54

14

11.68

84.53

-72.85

96.21

13.9

11.3

84.53

-73.23

95.82

9.2

-6.76

84.9

-91.66

78.14

15.5

17.44

84.52

-67.07

101.96

7.7

-12.52

85.12

-97.65

72.6

20

34.73

84.79

-50.06

119.52

25.9

57.39

85.82

-28.43

143.22

14.9

15.14

84.51

-69.38

99.65

17.4

24.74

84.58

-59.83

109.32

10.9

-0.23

84.71

-84.94

84.48

36

96.19

89.31

6.88

185.5

8.3

-10.22

85.03

-95.25

74.81

21.7

41.26

85.01

-43.75

126.27

23.3

47.41

85.27

-37.87

132.68

9.5

-5.61

84.86

-90.47

79.25

5.5

-20.97

85.54

-106.51

64.56

14

11.68

84.53

-72.85

96.21

24.5

52.02

85.51

-33.49

137.52

10.3

-2.53

84.77

-87.3

82.23

12.1

4.38

84.61

-80.23

88.99

16.8

22.44

84.55

-62.11

106.98

6.8

-15.98

85.28

-101.26

69.3

13.6

10.14

84.54

-74.4

94.68

19.4

32.42

84.72

-52.3

117.15

22.9

45.87

85.2

-39.33

131.07

14

11.68

84.53

-72.85

96.21

10.1

-3.3

84.79

-88.09

81.49

8.6

-9.07

84.98

-94.05

75.92

12.4

5.53

84.59

-79.06

90.13

13.2

8.61

84.55

-75.95

93.16

22

42.41

85.05

-42.64

127.46

20.8

37.8

84.88

-47.08

122.68

26.5

59.7

85.97

-26.27

145.67

15.8

18.59

84.52

-65.93

103.11

21

38.57

84.91

-46.34

123.48

18.4

28.58

84.64

-56.06

113.22

15.5

17.44

84.52

-67.07

101.96

14

11.68

84.53

-72.85

96.21

16.7

22.05

84.54

-62.49

106.6

9.1

-7.14

84.91

-92.06

77.77

13.3

8.99

84.55

-75.56

93.54

17.2

23.97

84.57

-60.59

108.54

5.4

-21.36

85.56

-106.92

64.2

12

4

84.62

-80.62

88.62

15.7

18.21

84.52

-66.31

102.73

23

46.25

85.22

-38.97

131.47

10.1

-3.3

84.79

-88.09

81.49

30.3

74.3

87.09

-12.79

161.38

24.3

51.25

85.47

-34.22

136.72

14.5

13.6

84.52

-70.92

98.12

21.6

40.88

84.99

-44.12

125.87

32.5

82.75

87.87

-5.12

170.62

12.2

4.76

84.61

-79.84

89.37

16.3

20.51

84.53

-64.02

105.05

9

-7.53

84.93

-92.46

77.4

15.9

18.98

84.52

-65.54

103.5

9.1

-7.14

84.91

-92.06

77.77

18.4

28.58

84.64

-56.06

113.22

9.7

-4.84

84.84

-89.68

80

13.9

11.3

84.53

-73.23

95.82

8.9

-7.91

84.94

-92.85

77.03


 

 

С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

2.5. Проверка гипотез относительно  коэффициентов линейного уравнения  регрессии.

1) t-статистика. Критерий  Стьюдента.

С помощью МНК мы получили лишь оценки параметров уравнения регрессии, которые характерны для конкретного статистического наблюдения (конкретного набора значений x и y).

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.

Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности используют статистические методы проверки гипотез.

В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля  параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.

H0: b = 0, то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности;

H1: b ≠ 0, то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности.

В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.

Найденное по данным наблюдений значение  t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике или эконометрике).

Табличное значение определяется в зависимости от уровня значимости (α) и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2), n-число наблюдений.

Если фактическое значение  t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-α) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.

Если фактическое значение  t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости α.

tкрит (n-m-1;α/2) = (97;0.025) = 1.984

EQ t = \f(b;S)

EQ t = \f(3.84;0.7) = 5.53

Отметим значения на числовой оси.

 

 

Отклонение H0, принятие H1

Принятие H0

Отклонение H0, принятие H1

2.5%

95%

2.5%

 

-1.984                          1.984

5.53


 

 

Поскольку 5.53  >  1.984, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

EQ t = \f(a;S)

EQ t = \f(-42.1;11.31) = 3.72

Поскольку 3.72  >  1.984, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

Доверительный интервал для коэффициентов уравнения регрессии.

Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:

(b - tкрит Sb; b + tкрит Sb)

(3.84 - 1.984 • 0.7; 3.84 + 1.984 • 0.7)

(2.462;5.221)

С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

(a - tкрит Sa; a + tкрит Sa)

(-42.102 - 1.984 • 11.31; -42.102 + 1.984 • 11.31)

(-64.538;-19.667)

С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

2) F-статистика. Критерий  Фишера.

Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.

Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.

Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.

EQ R = 1 - \f(∑ix2; ∑i2) = 1 - \f(174252.81;229104.81) = 0.2394

где m – число факторов в модели.

Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:

1. Выдвигается нулевая  гипотеза о том, что уравнение  в целом статистически незначимо: H0: R2=0 на уровне значимости α.

Информация о работе Модель простой регрессии