Модель парной линейной регрессии

Автор работы: Пользователь скрыл имя, 10 Мая 2013 в 07:43, контрольная работа

Описание работы

1. Рассчитать линейный коэффициент парной корреляции, оценить его статистическую значимость и построить для него доверительный интервал с уровнем значимости a=0,05. Сделать выводы

Файлы: 1 файл

вариант 8.doc

— 544.00 Кб (Скачать файл)

Вариант 8

Задание 1. Модель парной линейной регрессии

 

Имеются данные по 10 предприятиям одной  из отраслей промышленности между объемом  произведенной продукции (x) и балансовой прибылью (y)

№ предприятия

Объем реализованной продукции, млн. руб., x

Балансовая прибыль, млн. руб., y

1

491,8

133,8

2

483,0

124,1

3

481,7

92,4

4

478,7

92,9

5

476,9

61,4

6

475,2

72,4

7

474,4

99,3

8

459,5

60,9

9

452,9

74,0

10

446,5

66,1


 

1. Рассчитать линейный коэффициент парной корреляции, оценить его статистическую значимость и построить для него доверительный интервал с уровнем значимости a=0,05. Сделать выводы

Для определения степени тесноты  связи обычно используют линейный коэффициент корреляции:

  .                                                \* MERGEFORMAT

 

Для расчета коэффициента корреляции (1.1) строим расчетную таблицу (табл. 1.2):

Таблица 1.1

 

(

)2

(

)2

(

)*(
)

1

491,8

133,8

19,74

389,66

46,07

2122,44

909,42

2

483

124,1

10,94

119,68

36,37

1322,77

397,88

3

481,7

92,4

9,64

92,92

4,67

21,80

45,01

4

478,7

92,9

6,64

44,08

5,17

26,72

34,32

5

476,9

61,4

4,84

23,42

-26,33

693,26

-127,43

6

475,2

72,4

3,14

9,85

-15,33

235,00

-48,13

7

474,4

99,3

2,34

5,47

11,57

133,86

27,07

8

459,5

60,9

-12,56

157,75

-26,83

719,84

336,98

9

452,9

74

-19,16

367,10

-13,73

188,51

263,06

10

446,5

66,1

-25,56

653,31

-21,63

467,85

552,86

Итого

4720,6

877,3

 

1863,30

 

5932,12

2391,07

Среднее значение

472,06

87,73

         

 

По данным таблицы находим:

Для оценки статистической значимости коэффициента корреляции рассчитывают двухсторонний t-критерий Стьюдента:

                                                                   

.                                                            (1.2)

В нашем случае

     и       


Для построения интервальной оценки используют  
z-преобразование Фишера:

.                                                      (1.3)


Вначале строят доверительный интервал для M(z), а затем делают обратное  
z-преобразование.

Применяя z-преобразование для найденного коэффициента корреляции, получим

Доверительный интервал для M(z) будет иметь вид

,                                           (1.4)

где tg находится с помощью функции Лапласа F(tg)=g/2. Для g=0,95 имеем tg=1,96. Тогда

,

или

Обратное z-преобразование осуществляется по формуле

                                                         (1.5)


В результате находим

В указанных  границах на уровне значимости 0,05 заключен генеральный коэффициент корреляции r.

Таким образом, между показателями y и x существует значительная корреляционная зависимость.


 

2. Построить линейное уравнение парной регрессии y на x и оценить статистическую значимость параметров регрессии. Сделать рисунок.

По выборке ограниченного объема можно построить эмпирическое уравнение регрессии:

,                                                               (1.6)

где b0 и b1 – эмпирические коэффициенты регрессии.

 

Эмпирические коэффициенты находятся по следующим формулам:

,                                                            (1.7)

.                                              (1.8)

По данным таблицы находим

.

Получено уравнение регрессии (см. рис. 1.1):

                                                    (1.9)

Таким образом, с увеличением объема реализованной продукции (x) на 1 млн. руб. прибыль (y) возрастает в среднем на 1 млн. 280 тыс. руб. (что не соответствует действительности).


Рис. 1.1

Значимость коэффициентов регрессии  осуществляется с помощью t-критерия Стьюдента:

,                                                               (1.10)

где – дисперсия коэффициента регрессии.


так как для парной линейной регрессии t-критерий для коэффициента корреляции и коэффициента регрессии b1 совпадают.

Для коэффициента b0 оценку дисперсии можно получить по формуле:


.                                                               (1.11)

Тогда

 


Критическое значение критерия было уже найдено  И , и .

Определим предельную ошибки:

,

где . В нашем случае

,
.

В результате, получаем следующие  доверительные интервалы для  коэффициента регрессии:

,

или

 

 

3. Оценить качество уравнения регрессии при помощи коэффициента детерминации. Сделать выводы. Проверить качество уравнения регрессии при помощи F критерия Фишера.

Оценим качество уравнения регрессии  при помощи коэффициента детерминации. Коэффициент детерминации для линейной модели равен квадрату коэффициента корреляции


Это означает, что 51% вариации показателя y объясняется вариацией фактора x.

Значимость уравнения регрессии  в целом проверяется при помощи F-критерия Фишера, для линейной парной регрессии он будет иметь вид

,                                                         (1.12)

где F подчиняется распределению Фишера с уровнем значимости a и степенями свободы k1=1 и k2= n–2. В нашем случае

.


Поскольку критическое значение критерия равно и , то признается статистическая значимость построенного уравнения регрессии.

 

4. Выполнить прогноз доли оплаты труда структуре доходов семьи y при прогнозном значении среднедушевого денежного дохода x, составляющем 118% от среднего уровня. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал для уровня значимости a=0,05. Сделать выводы.

Полученные оценки уравнения  регрессии позволяют использовать его для прогноза. В нашем случае прогнозное значение показателя x составляет , тогда прогнозное значение показателя y составит:

.

Средняя стандартная ошибка прогноза вычисляется по формуле:

,                      (1.13)

где . В нашем случае

и

.

Предельная ошибка прогноза, которая  в 95% случаев не будет превышена, составит:

.

Доверительный интервал прогноза

,

или

.

Таким образом, предельное отклонение прогноза составляет . Выполненный прогноз оказался надежным, но не очень точным.

 

Задание 2. Модель парной нелинейной регрессии.

По территориям Центрального района известны данные за 1995 г.

Район

Среднемесячная начисленная заработная плата, тыс. руб., x

Доля денежных доходов, направленных на прирост сбережений во вкладах, займах, сертификатах и на покупку валюты, в общей сумме среднедушевого денежного дохода, %, y

Брянская обл.

289

6,9

Владимирская обл.

334

8,7

Ивановская обл.

300

6,4

Калужская обл.

343

8,4

Костромская обл.

356

6,1

Орловская обл.

289

9,4

Рязанская обл.

341

11,0

Смоленская обл.

327

6,4

Тверская обл.

357

9,3

Тульская обл.

352

8,2

Ярославская обл.

381

8,6


 

1. Постройте поле корреляции и сформулируйте гипотезу о форме связи. Рассчитайте параметры уравнений обратной ( ) и полулогарифмической ( ) парной регрессии. Сделайте рисунки.

Построим поле корреляции (рис.2.1). По виду расположения точек можно предположить, что имеется достаточно незначительная положительная корреляционная зависимость.

 

Рис. 2.1

Построению обратной модели

                                                                (2.1)

предшествует процедура линеаризации путем преобразования . В результате получается линейное уравнение регрессии:

.                                                               (2.2)

Вычисляем

,
.

Рис. 2.2

В результате, получим уравнение  обратной регрессии:

.                                                   (2.3)

Подставляя в данное уравнение  фактические значения x, получаем теоретические значения результата (см. рис. 2.2).

Полулогарифмическая модель

                                                   (2.4)

является линейной относительно параметров a и b. После преобразования получается классическое линейное уравнение регрессии:

.                                                      (2.5)

Вычисляем

,  
.

В результате, получим уравнение  полулогарифмической регрессии:

.                                                  (2.6)

Подставляя в данное уравнение  фактические значения x, получаем теоретические значения результата (см. рис. 2.3).

Рис. 2.3

 

2. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом для каждой модели. Сделайте выводы. Оцените качество уравнений регрессии с помощью средней ошибки аппроксимации и коэффициента детерминации. Сделайте выводы.

Средний коэффициент эластичности

                                                           (2.7)


показывает, насколько процентов  в среднем по совокупности изменится результат y от своей средней величины при изменении фактора x на 1% от своего среднего значения.

Для обратной функции

.                                  (2.8)

В нашем случае .

Для полулогарифмической функции

.                                  (2.9)

В нашем случае .

Таким образом, при возрастании темпов роста заработной платы на 1% уровень потребительских расходов увеличивается в среднем на 0,758% (для полулогарифмической модели).

Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:

.                                                (2.10)

Информация о работе Модель парной линейной регрессии