Автор работы: Пользователь скрыл имя, 29 Апреля 2012 в 09:54, контрольная работа
1. Построить выборочное уравнение линейной регрессии и дать экономическую интерпретацию его углового коэффициента b1 . Найти коэффициент детерминации и среднюю ошибку аппроксимации. Оценить статистическую значимость уравнения регрессии с помощью критерия Фишера на уровне значимости α = 0,05.
2. Построить выборочное уравнение гиперболической регрессии . Найти коэффициент детерминации и среднюю ошибку аппроксимации. Оценить статистическую значимость уравнения регрессии с помощью критерия Фишера на уровне значимости α = 0,05.
3. Выбрать наилучший вариант модели.
Задача 1. Парный регрессионный анализ
По 10 предприятиям региона изучается зависимость средней цены единицы товара Y (руб.) от суммы затрат на расширение производства Х (млн. руб.).
X | 2 | 4 | 6 | 8 | 10 | 12 | 14 | 16 | 18 | 20 |
Y | 100 | 67 | 69 | 58 | 55 | 52 | 52 | 54 | 45 | 40 |
Требуется:
1. Построить выборочное уравнение линейной регрессии и дать экономическую интерпретацию его углового коэффициента b1 . Найти коэффициент детерминации и среднюю ошибку аппроксимации. Оценить статистическую значимость уравнения регрессии с помощью критерия Фишера на уровне значимости α = 0,05.
2. Построить выборочное уравнение гиперболической регрессии . Найти коэффициент детерминации и среднюю ошибку аппроксимации. Оценить статистическую значимость уравнения регрессии с помощью критерия Фишера на уровне значимости α = 0,05.
3. Выбрать наилучший вариант модели.
Решение:
1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу 1:
Таблица 1
Расчет параметров уравнения линейной регрессии
i | Xi | Yi | XiYi | Xi2 | Yi2 | Ӯ | Yi-Ӯ | (Yi-Ӯ/Yi)*100 |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
1 | 2 | 100 | 200 | 4 | 10000 | 80,745 | 19,255 | 23,846 |
2 | 4 | 67 | 268 | 16 | 4489 | 75,958 | -8,958 | 11,793 |
3 | 6 | 69 | 414 | 36 | 4761 | 71,17 | -2,170 | 3,049 |
4 | 8 | 58 | 464 | 64 | 3364 | 66,382 | -8,382 | 12,627 |
5 | 10 | 55 | 550 | 100 | 3025 | 61,594 | -6,594 | 10,706 |
6 | 12 | 52 | 624 | 144 | 2704 | 56,806 | -4,806 | 8,46 |
7 | 14 | 52 | 728 | 196 | 2704 | 52,018 | -0,018 | 0,035 |
8 | 16 | 54 | 864 | 256 | 2916 | 47,23 | 6,770 | 14,333 |
9 | 18 | 45 | 810 | 324 | 2025 | 42,442 | 2,558 | 6,026 |
10 | 20 | 40 | 800 | 400 | 1600 | 37,655 | 2,345 | 6,229 |
сумма | 110 | 592 | 5722 | 1540 | 37588 | 592 | 0,000 | 97,104 |
ср.зн | 11 | 59,200 | 572,200 | 154,000 | 3758,800 | 59,200 | 0,000 | 9,710 |
Уравнение линейной регрессии имеет вид:
Ỹ, (1)
b1 =, (2)
где cov (x,y) =- - ковариация признаков x и y;
=- - дисперсия признака x
=, =, =, =
Из формулы (1) найдем параметры линейной регрессии:
b1===-2,394
b0= -b1=59.2+2.394*11=85.533
Получено уравнение регрессии:
y=85,533-2,394x
Параметр регрессии позволяет сделать вывод, что при увеличении суммы затрат на расширение производства на 1 млн. руб., средняя цена единицы товара в среднем уменьшится на 2,394 руб.
Для расчета коэффициента детерминации и средней ошибки аппроксимации заполняем столбцы 7-9 расчетной таблицы 1.
Средняя ошибка аппроксимации вычисляется по формуле (2):
Ā=
Ā==9,710.
Модель хорошо подобрана к выборочным данным, т.к. Ā не превышает 10%.
Тесноту линейной связи оценит коэффициент корреляции (4):
rxy=-0.863
Коэффициент регрессии:
R2=rxy2=(-0.863)2=0.744
Это означает, что 74% вариации средней цены товара (y) объясняется вариацией фактора x – суммы затрат на расширение производства.
Оценку статистической значимости уравнения регрессии в целом проведем с помощью F-критерия Фишера. Фактическое значение F- критерия определяется по формуле (5)
F=
где n – число наблюдений,
F==23,263
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтаб=5.32. Так как F=23.263≥Fтаб=5,32, то уравнение регрессии признается статистически значимым.
2. Выборочное уравнение гиперболической регрессии имеет вид:
Ӯ=b0+.
Сведем модель к линейному виду, для этого введем переменную z.
z=, следовательно уравнение регрессии примет вид: Ӯ=b0+b1z, параметры находятся аналогично пункту 1.
Составим расчетную таблицу 2.
Таблица 2
i | Xi | Yi | Zi | ZiYi | Zi2 | Ӯ | Yi-Ӯ | (Yi-Ӯ/Yi)*100 |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
1,000 | 2,000 | 100,000 | 0,500 | 50,000 | 0,250 | 100,540 | -0,540 | 0,54 |
2,000 | 4,000 | 67,000 | 0,250 | 16,750 | 0,063 | 71,308 | -4,308 | 6,43 |
3,000 | 6,000 | 69,000 | 0,167 | 11,500 | 0,028 | 61,564 | 7,436 | 10,77 |
4,000 | 8,000 | 58,000 | 0,125 | 7,250 | 0,016 | 56,692 | 1,308 | 2,255 |
5,000 | 10,000 | 55,000 | 0,100 | 5,500 | 0,010 | 53,769 | 1,231 | 2,238 |
6,000 | 12,000 | 52,000 | 0,083 | 4,333 | 0,007 | 51,820 | 0,180 | 0,346 |
7,000 | 14,000 | 52,000 | 0,071 | 3,714 | 0,005 | 50,428 | 1,572 | 3,023 |
8,000 | 16,000 | 54,000 | 0,063 | 3,375 | 0,004 | 49,384 | 4,616 | 8,458 |
9,000 | 18,000 | 45,000 | 0,056 | 2,500 | 0,003 | 48,572 | -3,572 | 7,938 |
10,000 | 20,000 | 40,000 | 0,050 | 2,000 | 0,003 | 47,922 | -7,922 | 19,806 |
сумма | 110,000 | 592,000 | 1,464 | 106,923 | 0,387 | 592,000 | 0,000 | 61,804 |
ср.знач. | 11,000 | 59,200 | 0,146 | 10,692 | 0,039 | 59,200 | 0,000 | 6,180 |
Параметры регрессии вычисляем по формуле (1) и (2):
b1===116.928.
b0=-b1z=59.2-116.928*0.146=42.
Получено уравнение гиперболической регрессии:
Ӯ=42,076+.
Для расчета средней ошибки аппроксимации и коэффициента детерминации заполним столбцы 7-9 таблицы 2.
Средняя ошибка аппроксимации находится по формуле (3):
Ā= =6,180.
Модель хорошо подобрана к выборочным данным, т.к. средняя ошибка аппроксимации не превышает 10%.
Выборочный коэффициент корреляции находится по формуле (4)
0,965.
Коэффициент регрессии:
R2=rxy2=(0,965)2=0,930
Это означает, что 93% вариации средней цены товара (y) объясняется вариацией фактора x – суммы затрат на расширение производства.
Оценку статистической значимости уравнения регрессии в целом проведем с помощью F-критерия Фишера. Фактическое значение F- критерия определяется по формуле (5)
F===107,066.
F=107,066
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтаб=5.32. Так как F=107,066≥Fтаб=5,32, то уравнение гиперболической регрессии признается статистически значимым.
3. Обе модели имеют приблизительно одинаковые характеристики, но модель гиперболической регрессии считается лучшей, так как коэффициент регрессии равен 0,930 (а это больше чем в линейной модели регрессии), а средняя ошибка аппроксимации равна 6,18 (соответственно меньше чем в линейной модели регрессии).
Задача 2. Множественный регрессионный анализ
По 10 предприятиям региона изучается зависимость выработки продукции на одного работника Y (тыс. руб.) от ввода в действие новых основных фондов X1 ( от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих X2 ().
X1 | 3,5 | 4 + 0,1m | 5 + 0,1n | 6 | 6,4 |
X2 | 9 | 10 + m | 15 + n | 19 | 22 |
Y | 6 | 7 | 8 | 9 | 10 |
X1 | 6,8 | 7 + 0,1m | 8 + 0,1n | 9 | 9,5 |
X2 | 23 | 25 + m | 30 + n | 33 | 35 |
Y | 11 | 12 | 13 | 14 | 15 |
Требуется:
1. Построить линейное уравнение множественной регрессии и пояснить экономический смысл параметров уравнения. Найти коэффициент множественной детерминации, в том числе скорректированный. Сделать выводы
2. Оценить статистическую значимость уравнения регрессии с помощью критерия Фишера на уровне значимости α = 0,05.
3. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
4. С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .
Решение:
1.Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу 3
Таблица 3
i | X1 | X2 | Yi | YX1 | YX2 | X1X2 | X1^2 | X2^2 | Y^2 |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
1 | 3,500 | 9 | 6 | 21,000 | 54 | 31,500 | 12,250 | 81 | 36,000 |
2 | 4,200 | 12 | 7 | 29,400 | 84 | 50,400 | 17,640 | 144 | 49,000 |
3 | 5,900 | 24 | 8 | 47,200 | 192 | 141,600 | 34,810 | 576 | 64,000 |
4 | 6,000 | 19 | 9 | 54,000 | 171 | 114,000 | 36,000 | 361 | 81,000 |
5 | 6,400 | 22 | 10 | 64,000 | 220 | 140,800 | 40,960 | 484 | 100,000 |
6 | 6,800 | 23 | 11 | 74,800 | 253 | 156,400 | 46,240 | 529 | 121,000 |
7 | 7,200 | 27 | 12 | 86,400 | 324 | 194,400 | 51,840 | 729 | 144,000 |
8 | 8,900 | 39 | 13 | 115,700 | 507 | 347,100 | 79,210 | 1521 | 169,000 |
9 | 9,000 | 33 | 14 | 126,000 | 462 | 297,000 | 81,000 | 1089 | 196,000 |
10 | 9,500 | 35 | 15 | 142,500 | 525 | 332,500 | 90,250 | 1225 | 225,000 |
67,400 | 243 | 105 | 761,000 | 2792 | 1805,700 | 490,200 | 6739 | 1185,000 | |
ср. знач | 6,740 | 24,3 | 10,5 | 76,100 | 279,2 | 180,570 | 49,020 | 673,9 | 118,500 |
Найдем средние квадратические отклонения признаков:
==2,872;
==1,895;
9,133.
Для нахождения параметров линейного уравнения множественной регрессии Ӯ=b0+b1x1+b2x2
необходимо решить систему линейных уравнений относительно неизвестных параметров b0, b1, b2 или воспользоваться формулой (6).
Рассчитаем сначала парные коэффициенты корреляции:
rx1y===0.979,
rx2y===0.917,
rx1x2===0.970.
Находим по формуле (6) коэффициенты чистой регрессии и параметр а:
b1===2.293, (6)
b2===-0.173,
b0=Ӯ-b1x1-b2x2=10.500-2.293*6.
Таким образом получили следующее уравнение множественной регрессии:
Ӯ=-0,746+2,293x1-0.173x2.
Уравнение регрессии показывает, что при увеличении ввода в действие основных фондов на 1% (при неизменном уровне удельного веса рабочих высокой квалификации) выработка продукции на одного рабочего увеличивается в среднем на 2,293 тыс. руб, а при увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1% (при неизменном уровне ввода в действие новых основных фондов) выработка продукции на одного рабочего уменьшается в среднем на 0,173 тыс. руб.
После нахождения уравнения регрессии составим новую расчетную таблицу для определения теоритических знаний результативного признака, остаточной дисперсии и средней ошибки аппроксимации.
Таблица 4
i | X1 | X2 | Ӯ | Y-Ӯ | (Y-Ӯ)^2 | (Yi-Ӯ/Yi) |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
1 | 3,500 | 9,000 | 5,720 | 0,280 | 0,078 | 9,574 |
2 | 4,200 | 12,000 | 6,806 | 0,194 | 0,038 | 9,428 |
3 | 5,900 | 24,000 | 8,626 | -0,626 | 0,392 | 18,501 |
4 | 6,000 | 19,000 | 9,721 | -0,721 | 0,520 | 17,501 |
5 | 6,400 | 22,000 | 10,119 | -0,119 | 0,014 | 9,727 |
6 | 6,800 | 23,000 | 10,863 | 0,137 | 0,019 | 6,516 |
7 | 7,200 | 27,000 | 11,087 | 0,913 | 0,833 | 0,489 |
8 | 8,900 | 39,000 | 12,907 | 0,093 | 0,009 | 5,857 |
9 | 9,000 | 33,000 | 14,175 | -0,175 | 0,031 | 7,354 |
10 | 9,500 | 35,000 | 14,976 | 0,024 | 0,001 | 5,531 |
сумма | 67,400 | 243,000 | 105,000 | 0,000 | 1,934 | 90,478 |
ср.знач | 6,740 | 24,300 | 10,500 | 0,000 | 0,193 | 9,048 |
Остаточная дисперсия:
==0,193.
Средняя ошибка аппроксимации:
Ā===9,048.
Качество моделей, исходя из относительных отклонений по каждому наблюдению, признается хорошим, т.к. средняя ошибка аппроксимации не превышает 10%.
Коэффициенты парной корреляции мы уже нашли:
rx1y=0,979, rx2y=0,917, rx1x2=0,970.
Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы x1 и x2 явно коллинеарные, т.к. rx1x2=0,970≥0,7). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.
Коэффициент множественной корреляции определяется через матрицы парных коэффициентов корреляции по формуле (7):
Ryx1x2= (7),
- определитель матрицы парных коэффициентов корреляции,
- определитель матрицы межфакторной корреляции.
Находим
=1(1-0,9702)-0,979(0,979-0,
=1-0,970*0,970=0,0594