Модель простой регрессии

Автор работы: Пользователь скрыл имя, 12 Марта 2016 в 11:51, контрольная работа

Описание работы

Математические модели широко используются в экономике, в финансах, в общественных науках. Обычно модели строятся и верифицируются на основе имеющихся наблюдений изучаемого показателя и, так называемых, объясняющих факторов. Язык экономики все больше становится математическим, а саму экономику все чаще упоминают как одну из наиболее математизированных наук. В течение последних десятилетий математические и, в частности, статистические методы в экономике стремительно развиваются. Свидетельством признания эконометрики является присуждение за наиболее выдающиеся работы в этой области Нобелевских премий по экономике: Р.Фришу и Я. Тинбергу (1969) за разработку математических методов анализа экономических процессов, Л. Клейну (1980) за создание эконометрических моделей и их применение к анализу экономических колебаний и экономической политике, Т. Хаавельмо (1989) за работы в области вероятностных основ эконометрики и анализ одновременных экономических структур, Дж. Хекману и Д. Макфаддену (2000) за развитие методов анализа селективных выборок и моделей дискретного выбора.

Файлы: 1 файл

Kursovaya_Model_prostoy_regressii_116529.doc

— 1.05 Мб (Скачать файл)

Метод устранения: взвешенный МНК.

Идея: если значения х оказывают какое-то воздействие на величину остатков, то можно ввести в модель некие «весовые коэффициенты», чтобы свести это влияние к нулю.

Например, если предположить, что величина остатка i пропорциональна значению xi (т. е., дисперсия остатков пропорциональна xi2), то можно перестроить модель следующим образом:

т. е. перейдем к модели наблюдений

где

Таким образом, задача оценки параметров уравнения регрессии методом наименьших квадратов сводится к минимизации функции:

или

где - весовой коэффициент.

  • 1.11 Выводы

 

- Эконометрика — это наука, в рамках которой на базе реальных статистических данных строятся, анализируются и совершенствуются математические модели экономических явлений. Эконометрика позволяет найти количественное подтверждение либо опровержение экономического закона, либо гипотезы. Одним из важнейших направлений эконометрики является построение прогнозов по различным экономическим показателям.

- Модель парной линейной регрессии является наиболее распространенным (и простым) уравнением зависимости между экономическими переменными. Метод наименьших квадратов дает наилучшие (в определенном смысле) оценки параметров регрессии. Решающее значение для правильного и обоснованного применения регрессионного анализа в эконометрических исследованиях имеет выполнение условий Гаусса–Маркова.

- Необходимым элементом эконометрического анализа является проверка статистической значимости полученных оценок коэффициентов, а также всего уравнения регрессии в целом. В качестве показателя качества регрессии может использоваться коэффициент детерминации.

- При использовании парной линейной регрессии для построения прогнозов необходимо учитывать доверительные интервалы прогноза и параметров регрессии.

2. Практическая часть

  • Задание 1

На основе данных 154  сельскохозяйственных предприятий Кемеровской области 2003  г. изучите зависимость рентабельность производства зерновых от урожайности зерновых (табл. 13).

Задание: 

1.Постройте поле корреляции  и сформулируйте гипотезу о  форме связи.

2. Рассчитайте параметры уравнения  регрессии (линейное, полулогарифмическое, логарифмическое, полиномиальное).

3.Оцените с помощью F-критерий Фишера статистическую надежность результатов регрессионного моделирования. По значениям характеристик каждого уравнения выберите лучшее уравнение и дайте обоснование.

4. Интерпретируйте полученные результаты.

Рисунок 2. Поле корреляции

 

Использование графического метода.

Этот метод применяют для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного признака X.

Совокупность точек результативного и факторного признаков называется полем корреляции.

На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.

Линейное уравнение регрессии имеет вид y = bx + a

Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.

Здесь ε - случайная ошибка (отклонение, возмущение).

Причины существования случайной ошибки:

1. Невключение в регрессионную модель значимых объясняющих переменных;

2. Агрегирование переменных. Например, функция суммарного потребления  – это попытка общего выражения  совокупности решений отдельных  индивидов о расходах. Это лишь  аппроксимация отдельных соотношений, которые имеют разные параметры.

3. Неправильное описание  структуры модели;

4. Неправильная функциональная  спецификация;

5. Ошибки измерения.

Так как отклонения εi  для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:

1) по наблюдениям xi и yi можно получить только оценки параметров α и β

2) Оценками параметров  α и β регрессионной модели  являются соответственно величины  а и b, которые носят случайный  характер, т.к. соответствуют случайной  выборке;

Для оценки параметров α и β - используют МНК (метод наименьших квадратов).

Метод наименьших квадратов дает наилучшие (состоятельные, эффективные и несмещенные) оценки параметров уравнения регрессии. Но только в том случае, если выполняются определенные предпосылки относительно случайного члена (ε) и независимой переменной (x).

Формально критерий МНК можно записать так:

S = ∑(yi - y*i)2 → min

Система нормальных уравнений.

a•n + b∑x = ∑y

a∑x + b∑x2 = ∑y•x

Для наших данных система уравнений имеет вид

99a + 1491.7 b = 1562.3

1491.7 a + 26193.35 b  = 37818.86

 

Домножим уравнение (1) системы на (-15.07), получим систему, которую решим методом алгебраического сложения.

-1491.7a -22479.92 b = -23543.86

1491.7 a + 26193.35 b  = 37818.86

Получаем:

3713.43 b  = 14275

Откуда b = 3.8415

Теперь найдем коэффициент «a» из уравнения (1):

99a + 1491.7 b = 1562.3

99a + 1491.7 • 3.8415 = 1562.3

99a = -4168.13

a = -42.1024

Получаем эмпирические коэффициенты регрессии: b = 3.8415, a = -42.1024

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 3.8415 x + 42.1024

 

Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.

Для расчета параметров регрессии построим расчетную таблицу (табл. 1)

 

 

x

y

x2

y2

x • y

10

-31.6

100

998.56

-316

12.7

33.3

161.29

1108.89

422.91

18

10

324

100

180

14.5

-16.9

210.25

285.61

-245.05

11

0

121

0

0

8.3

-13.5

68.89

182.25

-112.05

11.2

-15.8

125.44

249.64

-176.96

16.8

22.2

282.24

492.84

372.96

10

-80.3

100

6448.09

-803

14.7

14.2

216.09

201.64

208.74

15.6

35.2

243.36

1239.04

549.12

9.2

1.6

84.64

2.56

14.72

12.5

3.6

156.25

12.96

45

8.8

-22.2

77.44

492.84

-195.36

14.9

64.6

222.01

4173.16

962.54

10.8

-24.9

116.64

620.01

-268.92

7.9

-44

62.41

1936

-347.6

23

4.2

529

17.64

96.6

10.7

6.8

114.49

46.24

72.76

21.8

26.8

475.24

718.24

584.24

14

18.5

196

342.25

259

18.6

-6.6

345.96

43.56

-122.76

13

-2.4

169

5.76

-31.2

11.3

-34.7

127.69

1204.09

-392.11

13.5

-7.1

182.25

50.41

-95.85

9.7

-21.7

94.09

470.89

-210.49

12.1

4

146.41

16

48.4

13.2

76.9

174.24

5913.61

1015.08

10.2

20.4

104.04

416.16

208.08

23.8

190.3

566.44

36214.09

4529.14

12.1

-34.8

146.41

1211.04

-421.08

32.2

88.6

1036.84

7849.96

2852.92

16.3

-17.6

265.69

309.76

-286.88

3.7

-36.7

13.69

1346.89

-135.79

19.6

132.4

384.16

17529.76

2595.04

15.3

13.2

234.09

174.24

201.96

13.3

186.1

176.89

34633.21

2475.13

14

-14.1

196

198.81

-197.4

13.9

2.6

193.21

6.76

36.14

9.2

0.7

84.64

0.49

6.44

15.5

-40.7

240.25

1656.49

-630.85

7.7

-40

59.29

1600

-308

20

53.1

400

2819.61

1062

25.9

38.4

670.81

1474.56

994.56

14.9

32.8

222.01

1075.84

488.72

17.4

20.7

302.76

428.49

360.18

10.9

-1

118.81

1

-10.9

36

51.6

1296

2662.56

1857.6

8.3

-5.6

68.89

31.36

-46.48

21.7

-4.6

470.89

21.16

-99.82

23.3

76.4

542.89

5836.96

1780.12

9.5

-22.4

90.25

501.76

-212.8

5.5

-33.3

30.25

1108.89

-183.15

14

135.8

196

18441.64

1901.2

24.5

62.8

600.25

3943.84

1538.6

10.3

-5

106.09

25

-51.5

12.1

15.4

146.41

237.16

186.34

16.8

38.1

282.24

1451.61

640.08

6.8

-23.7

46.24

561.69

-161.16

13.6

-21.9

184.96

479.61

-297.84

19.4

-7.7

376.36

59.29

-149.38

22.9

22.1

524.41

488.41

506.09

14

-24.3

196

590.49

-340.2

10.1

-21.5

102.01

462.25

-217.15

8.6

11.7

73.96

136.89

100.62

12.4

1.8

153.76

3.24

22.32

13.2

-44.8

174.24

2007.04

-591.36

22

7.1

484

50.41

156.2

20.8

127.2

432.64

16179.84

2645.76

26.5

14.6

702.25

213.16

386.9

15.8

-5.4

249.64

29.16

-85.32

21

52.9

441

2798.41

1110.9

18.4

5.3

338.56

28.09

97.52

15.5

101.3

240.25

10261.69

1570.15

14

-0.6

196

0.36

-8.4

16.7

-23.4

278.89

547.56

-390.78

9.1

-4.2

82.81

17.64

-38.22

13.3

70.5

176.89

4970.25

937.65

17.2

37.3

295.84

1391.29

641.56

5.4

-43.7

29.16

1909.69

-235.98

12

-4.1

144

16.81

-49.2

15.7

2.2

246.49

4.84

34.54

23

44.4

529

1971.36

1021.2

10.1

-30.9

102.01

954.81

-312.09

30.3

123.2

918.09

15178.24

3732.96

24.3

47.9

590.49

2294.41

1163.97

14.5

20.1

210.25

404.01

291.45

21.6

7

466.56

49

151.2

32.5

9.4

1056.25

88.36

305.5

12.2

36

148.84

1296

439.2

16.3

50.7

265.69

2570.49

826.41

9

25.7

81

660.49

231.3

15.9

65.2

252.81

4251.04

1036.68

9.1

-12.5

82.81

156.25

-113.75

18.4

-1.3

338.56

1.69

-23.92

9.7

-27

94.09

729

-261.9

13.9

31.1

193.21

967.21

432.29

8.9

-41.1

79.21

1689.21

-365.79

11.9

81.9

141.61

6707.61

974.61

1491.7

1562.3

26193.35

253759.17

37818.86


 

 

1. Параметры уравнения регрессии.

Выборочные средние.

EQ \x\to(x) = \f(∑i;n) =  \f(1491.7;99) = 15.07

EQ \x\to(y) = \f(∑i;n) =  \f(1562.3;99) = 15.78

EQ \x\to(xy) = \f(∑ii;n) =  \f(37818.86;99) = 382.01

Выборочные дисперсии:

EQ S(x) = \f(∑2i;n) - \x\to(x) =  \f(26193.35;99) - 15.07 = 37.54

EQ S(y) = \f(∑2i;n) - \x\to(y) =  \f(253759.17;99) - 15.78 = 2314.19

Среднеквадратическое отклонение

EQ S(x) = \r(S(x)) =  \r(37.54) = 6.127

EQ S(y) = \r(S(y)) =  \r(2314.19) = 48.106

Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:

EQ b = \f(\x\to(x • y)-\x\to(x) • \x\to(y);S(x)) = \f(382.01-15.07 • 15.78;37.54) = 3.8415

1.1. Коэффициент корреляции

Ковариация.

EQ cov(x,y) = \x\to(x • y) - \x\to(x) • \x\to(y) = 382.01 - 15.07 • 15.78 = 144.23

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

EQ r = \f(\x\to(x • y) -\x\to(x) • \x\to(y) ;S(x) • S(y)) = \f(382.01 - 15.07 • 15.78;6.127 • 48.106) = 0.489

Линейный коэффициент корреляции принимает значения от –1 до +1.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < rxy < 0.3: слабая;

0.3 < rxy < 0.5: умеренная;

0.5 < rxy < 0.7: заметная;

0.7 < rxy < 0.9: высокая;

0.9 < rxy < 1: весьма высокая;

В нашем примере связь между признаком Y фактором X  умеренная и прямая.

Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:

EQ r = b\f(S(x);S(y)) = 3.84\f(6.127;48.106) = 0.489

1.2. Уравнение регрессии (оценка уравнения регрессии).

EQ y = r \f(x - \x\to(x);S(x)) S(y)  + \x\to(y) = 0.489 \f(x - 15.07;6.127) 48.106 + 15.78 = 3.84x -42.1

Линейное уравнение регрессии имеет вид y = 3.84 x -42.1

Коэффициентам уравнения линейной регрессии можно придать экономический смысл.

Коэффициент регрессии b = 3.84 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 3.84.

Коэффициент a = -42.1 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.

Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.

Связь между у и х определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе - обратная). В нашем примере связь прямая.

1.3. Коэффициент эластичности.

Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х.

Для этих целей вычисляются коэффициенты эластичности и бета - коэффициенты.

Средний коэффициент эластичности E показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения.

Коэффициент эластичности находится по формуле:

EQ E = \f(∂y;∂x) \f(x;y) = b\f(\x\to(x);\x\to(y))

EQ E = 3.84\f(15.07;15.78) = 3.67

В нашем примере коэффициент эластичности больше 1. Следовательно, при изменении Х на 1%, Y изменится более чем на 1%. Другими словами - Х существенно влияет на Y.

Бета – коэффициент

Бета – коэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:

EQ β = b\f(S(x);S(y)) = 3.84\f(6.127;48.106) = 0.489

Т.е. увеличение x на величину среднеквадратического отклонения Sx приведет к увеличению среднего значения Y на 48.9% среднеквадратичного отклонения Sy.

1.4. Ошибка аппроксимации.

Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

EQ \x\to(A) = \f(∑;n)100%

Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.

EQ \x\to(A) = \f(91.898;99) 100% = 92.83%

Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве регрессии.

1.5. Эмпирическое корреляционное  отношение.

Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].

EQ η = \r(\f(∑x2; ∑i2) )

Информация о работе Модель простой регрессии