Автор работы: Пользователь скрыл имя, 10 Мая 2013 в 07:43, контрольная работа
1. Рассчитать линейный коэффициент парной корреляции, оценить его статистическую значимость и построить для него доверительный интервал с уровнем значимости a=0,05. Сделать выводы
Вариант 8
Имеются данные по 10 предприятиям одной из отраслей промышленности между объемом произведенной продукции (x) и балансовой прибылью (y)
№ предприятия |
Объем реализованной продукции, млн. руб., x |
Балансовая прибыль, млн. руб., y |
1 |
491,8 |
133,8 |
2 |
483,0 |
124,1 |
3 |
481,7 |
92,4 |
4 |
478,7 |
92,9 |
5 |
476,9 |
61,4 |
6 |
475,2 |
72,4 |
7 |
474,4 |
99,3 |
8 |
459,5 |
60,9 |
9 |
452,9 |
74,0 |
10 |
446,5 |
66,1 |
1. Рассчитать линейный коэффициент парной корреляции, оценить его статистическую значимость и построить для него доверительный интервал с уровнем значимости a=0,05. Сделать выводы
Для определения степени тесноты связи обычно используют линейный коэффициент корреляции:
.
Для расчета коэффициента корреляции (1.1) строим расчетную таблицу (табл. 1.2):
Таблица 1.1
( |
( |
( | |||||
1 |
491,8 |
133,8 |
19,74 |
389,66 |
46,07 |
2122,44 |
909,42 |
2 |
483 |
124,1 |
10,94 |
119,68 |
36,37 |
1322,77 |
397,88 |
3 |
481,7 |
92,4 |
9,64 |
92,92 |
4,67 |
21,80 |
45,01 |
4 |
478,7 |
92,9 |
6,64 |
44,08 |
5,17 |
26,72 |
34,32 |
5 |
476,9 |
61,4 |
4,84 |
23,42 |
-26,33 |
693,26 |
-127,43 |
6 |
475,2 |
72,4 |
3,14 |
9,85 |
-15,33 |
235,00 |
-48,13 |
7 |
474,4 |
99,3 |
2,34 |
5,47 |
11,57 |
133,86 |
27,07 |
8 |
459,5 |
60,9 |
-12,56 |
157,75 |
-26,83 |
719,84 |
336,98 |
9 |
452,9 |
74 |
-19,16 |
367,10 |
-13,73 |
188,51 |
263,06 |
10 |
446,5 |
66,1 |
-25,56 |
653,31 |
-21,63 |
467,85 |
552,86 |
Итого |
4720,6 |
877,3 |
1863,30 |
5932,12 |
2391,07 | ||
Среднее значение |
472,06 |
87,73 |
По данным таблицы находим:
Для оценки статистической значимости коэффициента корреляции рассчитывают двухсторонний t-критерий Стьюдента:
В нашем случае
Для построения интервальной оценки
используют
z-преобразование Фишера:
.
Вначале строят доверительный интервал
для M(z), а затем делают обратное
z-преобразование.
Применяя z-преобразование для найденного коэффициента корреляции, получим
Доверительный интервал для M(z) будет иметь вид
,
где tg находится с помощью функции Лапласа F(tg)=g/2. Для g=0,95 имеем tg=1,96. Тогда
или
Обратное z-преобразование осуществляется по формуле
В результате находим
В указанных
границах на уровне значимости 0,05 заключен
генеральный коэффициент коррел
Таким образом, между показателями y и x существует значительная корреляционная зависимость.
2. Построить линейное уравнение парной регрессии y на x и оценить статистическую значимость параметров регрессии. Сделать рисунок.
По выборке ограниченного
,
где b0 и b1 – эмпирические коэффициенты регрессии.
Эмпирические коэффициенты находятся по следующим формулам:
,
.
По данным таблицы находим
Получено уравнение регрессии (см. рис. 1.1):
Таким образом, с увеличением объема реализованной продукции (x) на 1 млн. руб. прибыль (y) возрастает в среднем на 1 млн. 280 тыс. руб. (что не соответствует действительности).
Рис. 1.1
Значимость коэффициентов
,
где – дисперсия коэффициента регрессии.
так как для парной линейной регрессии t-критерий для коэффициента корреляции и коэффициента регрессии b1 совпадают.
Для коэффициента b0 оценку дисперсии можно получить по формуле:
.
Тогда
Критическое значение критерия было уже найдено И , и .
Определим предельную ошибки:
где . В нашем случае
В результате, получаем следующие доверительные интервалы для коэффициента регрессии:
или
3. Оценить качество уравнения регрессии при помощи коэффициента детерминации. Сделать выводы. Проверить качество уравнения регрессии при помощи F критерия Фишера.
Оценим качество уравнения регрессии при помощи коэффициента детерминации. Коэффициент детерминации для линейной модели равен квадрату коэффициента корреляции
Это означает, что 51% вариации показателя y объясняется вариацией фактора x.
Значимость уравнения
,
где F подчиняется распределению Фишера с уровнем значимости a и степенями свободы k1=1 и k2= n–2. В нашем случае
Поскольку критическое значение критерия равно и , то признается статистическая значимость построенного уравнения регрессии.
4. Выполнить прогноз доли оплаты труда структуре доходов семьи y при прогнозном значении среднедушевого денежного дохода x, составляющем 118% от среднего уровня. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал для уровня значимости a=0,05. Сделать выводы.
Полученные оценки уравнения
регрессии позволяют
Средняя стандартная ошибка прогноза вычисляется по формуле:
, (1.13)
где . В нашем случае
и
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
Доверительный интервал прогноза
или
Таким образом, предельное отклонение прогноза составляет . Выполненный прогноз оказался надежным, но не очень точным.
По территориям Центрального района известны данные за 1995 г.
Район |
Среднемесячная начисленная заработная плата, тыс. руб., x |
Доля денежных доходов, направленных на прирост сбережений во вкладах, займах, сертификатах и на покупку валюты, в общей сумме среднедушевого денежного дохода, %, y |
Брянская обл. |
289 |
6,9 |
Владимирская обл. |
334 |
8,7 |
Ивановская обл. |
300 |
6,4 |
Калужская обл. |
343 |
8,4 |
Костромская обл. |
356 |
6,1 |
Орловская обл. |
289 |
9,4 |
Рязанская обл. |
341 |
11,0 |
Смоленская обл. |
327 |
6,4 |
Тверская обл. |
357 |
9,3 |
Тульская обл. |
352 |
8,2 |
Ярославская обл. |
381 |
8,6 |
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи. Рассчитайте параметры уравнений обратной ( ) и полулогарифмической ( ) парной регрессии. Сделайте рисунки.
Построим поле корреляции (рис.2.1). По виду расположения точек можно предположить, что имеется достаточно незначительная положительная корреляционная зависимость.
Рис. 2.1
Построению обратной модели
предшествует процедура
.
Вычисляем
Рис. 2.2
В результате, получим уравнение обратной регрессии:
.
Подставляя в данное уравнение фактические значения x, получаем теоретические значения результата (см. рис. 2.2).
Полулогарифмическая модель
является линейной относительно параметров a и b. После преобразования получается классическое линейное уравнение регрессии:
.
Вычисляем
В результате, получим уравнение полулогарифмической регрессии:
.
Подставляя в данное уравнение фактические значения x, получаем теоретические значения результата (см. рис. 2.3).
Рис. 2.3
2. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом для каждой модели. Сделайте выводы. Оцените качество уравнений регрессии с помощью средней ошибки аппроксимации и коэффициента детерминации. Сделайте выводы.
Средний коэффициент эластичности
показывает, насколько процентов в среднем по совокупности изменится результат y от своей средней величины при изменении фактора x на 1% от своего среднего значения.
Для обратной функции
.
В нашем случае .
Для полулогарифмической функции
.
В нашем случае .
Таким образом, при возрастании темпов роста заработной платы на 1% уровень потребительских расходов увеличивается в среднем на 0,758% (для полулогарифмической модели).
Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:
.