Парный регрессионный анализ

Автор работы: Пользователь скрыл имя, 29 Апреля 2012 в 09:54, контрольная работа

Описание работы

1. Построить выборочное уравнение линейной регрессии и дать экономическую интерпретацию его углового коэффициента b1 . Найти коэффициент детерминации и среднюю ошибку аппроксимации. Оценить статистическую значимость уравнения регрессии с помощью критерия Фишера на уровне значимости α = 0,05.
2. Построить выборочное уравнение гиперболической регрессии . Найти коэффициент детерминации и среднюю ошибку аппроксимации. Оценить статистическую значимость уравнения регрессии с помощью критерия Фишера на уровне значимости α = 0,05.
3. Выбрать наилучший вариант модели.

Файлы: 1 файл

контрольная работа.doc

— 276.00 Кб (Скачать файл)

Задача 1. Парный регрессионный анализ

 

По 10 предприятиям региона изучается зависимость средней цены единицы товара Y (руб.) от суммы затрат на расширение производства Х (млн. руб.).

 

X

2

4

6

8

10

12

14

16

18

20

Y

100

67

69

58

55

52

52

54

45

40

 

Требуется:

1. Построить выборочное уравнение линейной регрессии и дать экономическую интерпретацию его углового коэффициента b1 . Найти коэффициент детерминации и среднюю ошибку аппроксимации. Оценить статистическую значимость уравнения регрессии с помощью критерия Фишера на уровне значимости α = 0,05.

2. Построить выборочное уравнение гиперболической регрессии . Найти коэффициент детерминации и среднюю ошибку аппроксимации. Оценить статистическую значимость уравнения регрессии с помощью критерия Фишера на уровне значимости α = 0,05.

3. Выбрать наилучший вариант модели.

 

Решение:

1.                  Для расчета параметров уравнения линейной регрессии строим расчетную таблицу 1:

Таблица 1

Расчет параметров уравнения линейной регрессии

i

Xi

Yi

XiYi

Xi2

Yi2

Ӯ

Yi-Ӯ

(Yi-Ӯ/Yi)*100

1

2

3

4

5

6

7

8

9

1

2

100

200

4

10000

80,745

19,255

23,846

2

4

67

268

16

4489

75,958

-8,958

11,793

3

6

69

414

36

4761

71,17

-2,170

3,049

4

8

58

464

64

3364

66,382

-8,382

12,627

5

10

55

550

100

3025

61,594

-6,594

10,706

6

12

52

624

144

2704

56,806

-4,806

8,46

7

14

52

728

196

2704

52,018

-0,018

0,035

8

16

54

864

256

2916

47,23

6,770

14,333

9

18

45

810

324

2025

42,442

2,558

6,026

10

20

40

800

400

1600

37,655

2,345

6,229

сумма

110

592

5722

1540

37588

592

0,000

97,104

ср.зн

11

59,200

572,200

154,000

3758,800

59,200

0,000

9,710

Уравнение линейной регрессии имеет вид:

, (1)

b1 =, (2)

где cov (x,y) =- - ковариация признаков x и y;

=- - дисперсия признака x

=, =, =, =

 

Из формулы (1) найдем параметры линейной регрессии:

b1===-2,394

b0= -b1=59.2+2.394*11=85.533

Получено уравнение регрессии:

y=85,533-2,394x

Параметр регрессии позволяет сделать вывод, что при увеличении суммы затрат на расширение производства на 1 млн. руб., средняя цена единицы товара в среднем уменьшится на 2,394 руб.

Для расчета коэффициента детерминации и средней ошибки аппроксимации заполняем столбцы 7-9 расчетной таблицы 1.

Средняя ошибка аппроксимации вычисляется по формуле (2):

Ā=                                           (3)

Ā==9,710.

Модель хорошо подобрана к выборочным данным, т.к. Ā не превышает 10%.

Тесноту линейной связи оценит коэффициент корреляции (4):

                                           (4)

rxy=-0.863

Коэффициент регрессии:

R2=rxy2=(-0.863)2=0.744

Это означает, что 74% вариации средней цены товара (y) объясняется вариацией фактора x суммы затрат на расширение производства.

Оценку статистической значимости уравнения регрессии в целом проведем с помощью F-критерия Фишера. Фактическое значение F- критерия определяется по формуле (5)

F=                                                     (5)

где  n – число наблюдений,

F==23,263

Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтаб=5.32. Так как F=23.263≥Fтаб=5,32, то уравнение регрессии признается статистически значимым.

2.      Выборочное уравнение гиперболической регрессии имеет вид:

Ӯ=b0+.

Сведем модель к линейному виду, для этого введем переменную z.

z=, следовательно уравнение регрессии примет вид: Ӯ=b0+b1z, параметры  находятся аналогично пункту 1.

Составим расчетную таблицу 2.

 

Таблица 2

i

Xi

Yi

Zi

ZiYi

Zi2

Ӯ

Yi-Ӯ

(Yi-Ӯ/Yi)*100

1

2

3

4

5

6

7

8

9

1,000

2,000

100,000

0,500

50,000

0,250

100,540

-0,540

0,54

2,000

4,000

67,000

0,250

16,750

0,063

71,308

-4,308

6,43

3,000

6,000

69,000

0,167

11,500

0,028

61,564

7,436

10,77

4,000

8,000

58,000

0,125

7,250

0,016

56,692

1,308

2,255

5,000

10,000

55,000

0,100

5,500

0,010

53,769

1,231

2,238

6,000

12,000

52,000

0,083

4,333

0,007

51,820

0,180

0,346

7,000

14,000

52,000

0,071

3,714

0,005

50,428

1,572

3,023

8,000

16,000

54,000

0,063

3,375

0,004

49,384

4,616

8,458

9,000

18,000

45,000

0,056

2,500

0,003

48,572

-3,572

7,938

10,000

20,000

40,000

0,050

2,000

0,003

47,922

-7,922

19,806

сумма

110,000

592,000

1,464

106,923

0,387

592,000

0,000

61,804

ср.знач.

11,000

59,200

0,146

10,692

0,039

59,200

0,000

6,180

Параметры регрессии вычисляем по формуле (1) и (2):

b1===116.928.

b0=-b1z=59.2-116.928*0.146=42.076.

Получено уравнение гиперболической регрессии:

Ӯ=42,076+.

Для расчета средней ошибки аппроксимации и коэффициента детерминации заполним столбцы 7-9 таблицы 2.

Средняя ошибка аппроксимации находится по формуле (3):

Ā= =6,180.

Модель хорошо подобрана к выборочным данным, т.к. средняя ошибка аппроксимации не превышает 10%.

Выборочный коэффициент корреляции находится по формуле (4)

 

0,965.

Коэффициент регрессии:

R2=rxy2=(0,965)2=0,930

Это означает, что 93% вариации средней цены товара (y) объясняется вариацией фактора x суммы затрат на расширение производства.

Оценку статистической значимости уравнения регрессии в целом проведем с помощью F-критерия Фишера. Фактическое значение F- критерия определяется по формуле (5)

F===107,066.

F=107,066

Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтаб=5.32. Так как F=107,066Fтаб=5,32, то уравнение гиперболической регрессии признается статистически значимым.

3.      Обе модели имеют приблизительно одинаковые характеристики, но модель гиперболической регрессии считается лучшей, так как коэффициент регрессии равен 0,930 (а это больше чем в линейной модели регрессии), а средняя ошибка аппроксимации равна 6,18 (соответственно меньше чем в линейной модели регрессии).

 

 

Задача 2. Множественный регрессионный анализ

 

По 10 предприятиям региона изучается зависимость выработки продукции на одного работника Y (тыс. руб.) от ввода в действие новых основных фондов X1 ( от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих X2 ().

 

X1

3,5

4 + 0,1m

5 + 0,1n

6

6,4

X2

9

10 + m

15 + n

19

22

Y

6

7

8

9

10

X1

6,8

7 + 0,1m

8 + 0,1n

9

9,5

X2

23

25 + m

30 + n

33

35

Y

11

12

13

14

15

 

Требуется:

1. Построить линейное уравнение множественной регрессии и пояснить экономический смысл параметров уравнения. Найти коэффициент множественной детерминации, в том числе скорректированный. Сделать выводы

2. Оценить статистическую значимость уравнения регрессии с помощью критерия Фишера на уровне значимости α = 0,05.

3. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.

4. С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .

 

Решение:

1.Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу 3

Таблица 3

i

X1

X2

Yi

YX1

YX2

X1X2

X1^2

X2^2

Y^2

1

2

3

4

5

6

7

8

9

10

1

3,500

9

6

21,000

54

31,500

12,250

81

36,000

2

4,200

12

7

29,400

84

50,400

17,640

144

49,000

3

5,900

24

8

47,200

192

141,600

34,810

576

64,000

4

6,000

19

9

54,000

171

114,000

36,000

361

81,000

5

6,400

22

10

64,000

220

140,800

40,960

484

100,000

6

6,800

23

11

74,800

253

156,400

46,240

529

121,000

7

7,200

27

12

86,400

324

194,400

51,840

729

144,000

8

8,900

39

13

115,700

507

347,100

79,210

1521

169,000

9

9,000

33

14

126,000

462

297,000

81,000

1089

196,000

10

9,500

35

15

142,500

525

332,500

90,250

1225

225,000

67,400

243

105

761,000

2792

1805,700

490,200

6739

1185,000

ср.

знач

6,740

24,3

10,5

76,100

279,2

180,570

49,020

673,9

118,500

Найдем средние квадратические отклонения признаков:

==2,872;

==1,895;

9,133.

Для нахождения параметров линейного уравнения множественной регрессии Ӯ=b0+b1x1+b2x2

необходимо решить систему линейных уравнений относительно неизвестных параметров b0, b1, b2 или воспользоваться формулой (6).

Рассчитаем сначала парные коэффициенты корреляции:

rx1y===0.979,

rx2y===0.917,

rx1x2===0.970.

Находим по формуле (6) коэффициенты чистой регрессии и параметр а:

b1===2.293,       (6)

b2===-0.173,

b0=Ӯ-b1x1-b2x2=10.500-2.293*6.740+0.173*24.300=-0.746.

Таким образом получили следующее уравнение множественной регрессии:

Ӯ=-0,746+2,293x1-0.173x2.

Уравнение регрессии показывает, что при увеличении ввода в действие основных фондов на 1% (при неизменном уровне удельного веса рабочих высокой квалификации) выработка продукции на одного рабочего увеличивается в среднем на 2,293 тыс. руб, а при увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1% (при неизменном уровне ввода в действие новых основных фондов) выработка продукции на одного рабочего уменьшается в среднем на 0,173 тыс. руб.

После нахождения уравнения регрессии составим новую расчетную таблицу для определения теоритических знаний результативного признака, остаточной дисперсии и средней ошибки аппроксимации.

Таблица 4

i

X1

X2

Ӯ

Y-Ӯ

(Y-Ӯ)^2

(Yi-Ӯ/Yi)
*100

1

2

3

4

5

6

7

1

3,500

9,000

5,720

0,280

0,078

9,574

2

4,200

12,000

6,806

0,194

0,038

9,428

3

5,900

24,000

8,626

-0,626

0,392

18,501

4

6,000

19,000

9,721

-0,721

0,520

17,501

5

6,400

22,000

10,119

-0,119

0,014

9,727

6

6,800

23,000

10,863

0,137

0,019

6,516

7

7,200

27,000

11,087

0,913

0,833

0,489

8

8,900

39,000

12,907

0,093

0,009

5,857

9

9,000

33,000

14,175

-0,175

0,031

7,354

10

9,500

35,000

14,976

0,024

0,001

5,531

сумма

67,400

243,000

105,000

0,000

1,934

90,478

ср.знач

6,740

24,300

10,500

0,000

0,193

9,048

 

Остаточная дисперсия:

==0,193.

Средняя ошибка аппроксимации:

Ā===9,048.

Качество моделей, исходя из относительных отклонений по каждому наблюдению, признается хорошим, т.к. средняя ошибка аппроксимации не превышает 10%.

Коэффициенты парной корреляции мы уже нашли:

rx1y=0,979, rx2y=0,917, rx1x2=0,970.

Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы x1 и x2 явно коллинеарные, т.к. rx1x2=0,970≥0,7). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.

Коэффициент множественной корреляции определяется через матрицы парных коэффициентов корреляции по формуле (7):

Ryx1x2= (7),

- определитель матрицы парных коэффициентов корреляции,

- определитель матрицы межфакторной корреляции.

Находим

=1(1-0,9702)-0,979(0,979-0,970*0,917)+0,917(0,979*0,970-         -0,917)=0,0014.

=1-0,970*0,970=0,0594

 

Информация о работе Парный регрессионный анализ