Автор работы: Пользователь скрыл имя, 06 Апреля 2012 в 16:13, контрольная работа
Из графика может быть сделан вывод о возможной форме связи валового регионального продукта (У) с инвестициями в основной капитал (X). В этом случае для описания зависимости следует построить несколько моделей разного вида и на основе оценочных характеристик выбрать оптимальную форму модели.
Задача №1
Решение:
1 .Для построения графика расположим территории по возрастанию значений фактора Х. Это отражено в таблице №1.
Таблица №1
Территория федерального округа | Инвестиции в основной капитал, млрд. руб., X | Валовой региональный продукт, млрд.руб., Y |
1. Карачаево-Черкесская Республика | 0,610 | 4,3 |
2. Республика Ингушетия | 0,930 | 2,0 |
3. Республика Адыгея | 1,264 | 5,1 |
4. Республика Северная Осетия-Алания | 1,600 | 7,6 |
5. Кабардино-Балкарская республика | 2,382 | 10,5 |
6. Республика Дагестан | 3,344 | 13,0 |
7. Республика Калмыкия | 6,689 | 2,1 |
8. Волгоградская область | 10,936 | 50,0 |
9. Астраханская область | 12,633 | 18,9 |
10. Ставропольский край | 15,104 | 43,4 |
11. Ростовская область | 20,014 | 69,0 |
Итого | 75,506 | 225,9 |
Средняя | 6,8642 | 20,536 |
Среднее квадратическое отклонение | 6,4427 | 21,852 |
Дисперсия | 41,5079 | 477,50 |
Построим график, с помощью которого, можно сделать вывод о возможной связи валового регионального продукта (Y) с инвестициями в основной капитал (Х).
Рисунок 1 – Связь Х и Y
Из графика может быть сделан вывод о возможной форме связи валового регионального продукта (У) с инвестициями в основной капитал (X). В этом случае для описания зависимости следует построить несколько моделей разного вида и на основе оценочных характеристик выбрать оптимальную форму модели.
2. Построим поле корреляции
Рисунок 2 – Поле корреляции результата (валовый региональный продукт) и фактора (инвестиции в основной капитал)
На основании поля корреляции можно сделать вывод , что между факторным (Х) и результативным (Y) признаками существует прямая зависимость.
3. Обычно моделирование начинается в построения уравнения прямой: y=a0+a1*x, отражающей линейную форму зависимости результата У от фактора X
4. Расчёт неизвестных параметров уравнения выполним методом наименьших квадратов (МНК), построив систему нормальных уравнений и решая её, относительно неизвестных а0 и а1. Для расчёта используем значения определителей второго порядка А, Дао и Да} Расчётные процедуры представим в разработочной таблице №2
Таблица №2
№ | X | у 1 факт. | X1 | У *Х | у | расч. | dу | d2у | §ц |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
1 | 0,610 | 4,3 | 0,37 | 2,62 | 8,1 | -0,8 | 0,6 | 5,2 |
2 | 0,930 | 2,0 | 0,86 | 1,86 | 9,4 | -од | 0,0 | 0,4 |
3 | 1,264 | 5,1 | 1,60 | 6,45 | 11,1 | 2,9 | 8,4 | 19,5 |
4 | 1,600 | 7,6 | 2,56 | 12,16 | П,1 | -1,7 | 2,9 | 11,2 |
5 | 2,382 | 10,5 | 5,67 | 25,01 | 13,9 | 1,7 | 2,9 | 10,9 |
6 | 3,344 | 13,0 | 11,18 | 43,47 | 14,5 | -2,4 | 5,7 | 15,7 |
7 | 6,689 | 2,1 | 44,74 | 14,05 | 15,5 | 0,8 | 0,6 | 5,5 |
8 | 10,936 | 50,0 | 119,60 | 546,80 | 18,4 | -1,7 | 2,9 | П,3 |
9 | 12,633 | 18,9 | 159,59 | 238,76 | 19,3 | 1,2 | 1,4 | 8,0 |
10 | 15,104 | 43,4 | 228,13 | 655,51 |
|
|
| |
11 | 20,014 | 69,0 | 400,56 | 1380,97 |
|
|
|
|
Итого | 75,506 | 225,9 | 974,87 | 2927,66 | 121,2 | 0,0 | 25,4 98,4 | |
Средняя | 6,8642 | 20,536 | — | — | — | — |
| 10,9 |
Сигма | 6,4427 | 21,852 |
| — | — | — | — | — |
Дисперсия, | 41,5079 | 477,50 | — | — | — | — | -— | _ |
А= | 5022,41 | — | — | — |
| — |
| — |
Аао= | -832,757 | ппп | -0,165 | — | — | — | — | — |
Аа1= | 15147,45 | ; а\ = | 3,015 |
| — | — | — | — |
3. Расчёт определителя системы выполним по формуле:
А = л*2(*2)~ХЖ*Х;^ = 9*6373,61225,0*225,0 щ 6737,76;
Расчёт определителя свободного члена уравнения выполним по формуле:
Дяо 111 * I(X2) IX <7 * Л * XX = 121,2*6373,6 - 3331,0*225,0123012,4.
Расчёт определителя коэффициента регрессии выполним по формуле:
Щ = п *X(У *X) - X У * X X = 9*3331,0 - 121,2*225,0 - 2708,91.
4.Расчёт параметров уравнения регрессии даёт следующие результаты:
Аа0 23012,4 ЩШ Да, 2708,91 ШШ
а =—У- =-— = 3,415; ах-—- =--— = 0,402.
А 6737,76 А 6737,76
В конечном счёте, получаем теоретическое уравнение регрессии следующего вида:
1 =1415 + 0,402**
В уравнении коэффициент регрессии щ Ш 0,415 означает, что при увеличении доходов населения на 1 тыс. руб. (от своей средней) объём розничного товарооборота возрастёт на 0,415 млрд. руб. (от своей средней).
Свободный член уравнения ао —3,415 оценивает влияние прочих факторов, оказывающих воздействие на объём розничного товарооборота.
5.Относительную оценку силы связи даёт общий (средний) коэффициент эластичности:
В нашем случае, когда рассматривается линейная зависимость, расчётная формула преобразуется к виду:
— ,Х _______25.0
Это означает, что при изменении инвестиций в основной капитал на 1% от своей средней валовый региональный продукт увеличивается на 1,007 процента от своей средней.
6. Для оценки тесноты связи рассчитаем линейный коэффициент парной корреляции:
ГУХа* ^ = 0,402 * 11110,9075 гух 2 Щ 0,824.4,04
Коэффициент корреляции, равный 0,8889, показывает, что выявлена весьма тесная зависимость между инвестициями в основной капитал за год и валовым региональным продуктом за год.
Коэффициент детерминации, равный 0,790, устанавливает, что вариация оборота розничной торговли на 79,0% из 100% предопределена вариацией инвестиций в основном капитале; роль прочих факторов, влияющих на валовый региональный продукт, определяется в 21,0%, что является сравнительно небольшой величиной.
7.Для оценки статистической надёжности выявленной зависимости дохода от доли занятых рассчитаем фактическое значение /^критерия Фишера - Рфштич. и сравним его с табличным значением ~ Рщ^а, По результатам сравнения примем решения по нулевой гипотезе Н0: а0 =ах = ггх в 0, то есть, либо примем, либо отклоним её с вероятностью допустить ошибку, которая не превысит 5% (или с уровнем значимости 0=0,05).
В нашем случае, Рфакт = ———-:-= —-:-= 4,68: — = 32,8.
Фактическое значение критерия показывает, что факторная вариация результата почти в 33 раза больше остаточной вариации, сформировавшейся под влиянием случайных причин. Очевидно, что подобные различия не могут быть случайными, а являются результатом систематического взаимодействия оборота розничной торговли и общей суммы доходов населения. Для обоснованного вывода сравним полученный результат с табличным значением критерия: Ртабл = 5,59 при степенях свободы 1=к-1=1 и (1./.2~п-к—9~2= 7 и уровне значимости а=0,05.
Значения Ряш6Лш представлены в таблице «Значения /^-критерия Фишера для уровня значимости 0,05 (или 0,01)». См. приложение 1 данных «Методических указаний...». В силу того, что Рфакт, = 32,8 > Ртабл - 5,59, нулевую гипотезу о статистической незначимости выявленной зависимости оборота розничной торговли от общей суммы доходов населения и её параметрах можно отклонить с фактической вероятностью допустить ошибку значительно меньшей, чем традиционные 5%.
8. Определим теоретические значения результата Утеор. Для этого в полученное уравнение последовательно подставим фактические значения фактора X и выполним расчёт. Например, И = 3,415 + 0,402 * 11,6 = 8,1. См. гр. 5 расчётной таблицы. По парам значений У „и,. ор. и Хфакт. строится теоретическая линия регрессии, которая пересечётся с эмпирической регрессией в нескольких точках. См. график 1.
9. Оценкудсачества модели дадим с помощью скорректированной средней ошибки аппроксимации:
г*
е =
факт
* 100 % = 10,9%
10. Построение логарифмической функции предполагает предварительное выполнение процедуры линеаризации исходных переменных. В данном случае, для преобразования нелинейной функции У = а0 +ах *\пХ в линейную введём новую переменную Ь-\пХ, которая линейно связана с результатом. Следовательно, для определения параметров модели У = а0 +а{ Щ будут использованы традиционные расчётные приёмы, основанные на значениях определителей второго порядка. См. расчётную таблицу №4.
Расчётная таблица №4
№ | X | \пХ | у факт. | (1пХ)2 | У*\пХ | у расч. | 4У | с12У |
|
А | 1 | 2 | 3 | 4 | 5 | 6 | 1 | 8 | 9 |
1 | 11,6 | 2,451 | 7,3 | 6,007 | 17,892 | 7,0 | 0,3 | 0,1 | 2,4 |
2 | 14,8 | 2,695 | 9,3 | 7,261 | 25,060 | 9,3 | 0,0 | 0,0 | 0,4 |
3 | 19,0 | 2,944 | 14,0 | 8,670 | 41,222 | 11,6 | 2,4 | 5,8 | 17,9 |
4 | 19,1 | 2,950 | 9,4 | 8,701 | 27,727 | 11,6 | -2,2 | 4,8 | 16,6 |
5 | 26,2 | 3,266 | 15,6 | 10,665 | 50,946 | 14,6 | 1,0 | 1,0 | 7,6 |
6 1 | 27,5 | 3,314 | ■ | 10,984 | 40,102 | 15,0 | -2,9 | 8,4 | 21,8 |
7 | 30,0 | 3,401 | Щ | 11,568 | 55,440 | 15,8 | 0,5 | 0,3 | 3,4 |
8 ] | 37,3 | 3,619 | 16,7 | 13,097 | 60,437 | 17,9 | -1,2 | 1,4 | 8,8 |
9 | 39,5 | 3,676 | 20,5 | 13,515 | 75,364 | 18,4 | 2,1 | 4,4 | 15,5 |
Итого |
| 28,316 | 121,2 | 90,468 | 394,190 | 121,2 | 0,0 | 26,2 | 94,2 |
Средняя |
| 3,146 | 13,5 |
|
|
|
| 2,9 | 10,5 |
Сигма |
| 0,391 | 4,04 | ||||||
Дисперсия, В |
| 0,153 | 16,29 |
Расчёт определителей второго порядка даёт следующие результаты:
Д ж 12,408; Аа0 щ -197,205; Аа{ 1115,787. Отсюда получаем параметры уравнения:
-197,205 1ГОЛ 115,787 Ш|
а0 I--= -15,89 ах =---= 9,332
12,408 1 12,408
Оценочные показатели позволяют сделать вывод, что линейно-логарифмическая функция описывает изучаемую связь хуже, чем линейная модель: оценка тесноты выявленной связи р=0,9066 (сравните с 0,9075), скорректированная средняя ошибка аппроксимации здесь выше и составляет 10,5%, то есть возможности использования для прогноза данной модели более ограничены.
Таким образом, можно придти к выводу, что по сравнению с линейной моделью данное уравнение менее пригодно для описания изучаемой связи.
11. Выполним расчёт параметров уравнения параболы второго порядка. В этом случае используются определители третьего порядка, расчёт которых выполняется по стандартным формулам и требует особого внимания и точности. См. расчётную таблицу 5 По материалам табл. 5 выполним расчёт четырёх определителей третьего порядка по следующим формулам:
I = п*Ех2*Ех4 + Ех*Ех3*Ех? + Ех*Ех3*Ех2 -Ех2*Ех2*Ех2-Ех*Ех*Ех4-Ех3*Ех3
Ла01 2у*2&*Ех4+Ех*Ех**Е(у *х2)+Е(у*х)*Ех3*Ех?-Е(у*х*)*Ех
Е(у*х) *Ех*Ех4-Ех3*Ех3*Еу = 751.979.368,8 4а1=п*Е(у*х)*Ех4 + Еу*Ех3*Ех2 + ЕхЩу*х2)*Ех2-Ех2*Е(у*х)*Ех2-
-Е(у*х2)*ЕхГ*п I167.288.933,1 Да2~п*Ех2*Е(у*х2) +Ех*Еух*Ех* +Ех*Ех**Еу ~Ех2*Ех2*Ху-Ех*Ех*Е(у*х2) -
- Ех3 *Е(у *х) *п = - 656.926,8 В результате получаем следующие значения параметров уравнения параболы: Л^= 751.979.368,8= 167.288.933,1 -656.926,8
А 331.854.860,7 331.854.860,7 331.854.860,7
Уравнение имеет следующий вид: / = 2,266 + 0,5041 * х - 0,00198 * х2. Для него показатель детерминации составляет 82,7%, Рфаюпич- 14,3, а ошибка аппроксимации е% - 10,7%. Как видим, по сравнению с линейной функцией построите уравнения параболы гораздо сложнее, а изучаемую зависимость она описывает почти с той же точностью, хотя надёжность уравнения параболы значительно ниже (для линейной модели Рфактич^ 32,8, а для параболы Рфактич-- 14,3). Поэтому в дальнейшем анализе парабола второго порядка использоваться не будет.
Расчётная таблица №5
| X | у факт. | У*Х | X2 | X2 | X4 | У*Х2 | у расч. | <1У | а2у |
|
А | 1 | 2 | 3 | 4 | 5 | 6 | 1 | 8 | 9 | 10 | 11 |
I | 11,6 | 7,3 | 84,7 | 6,007 | 17,892 | 18106,4 | 982,3 | 7,8 | -0,5 | 0,3 | 4,1 |
2 | 14,8 | 9,3 | 137,6 | 7,261 | 25,060 | 47978,5 | 2037,1 | 9,3 | 0,0 | 0,0 | 0,1 |
3 | 19 | 14,0 | 266,0 | 8,670 | 41,222 | 130321,0 | 5054,0 | 11,1 | 2,9 | 8,4 | 21,3 |
4 | 19,1 | 9,4 | 179,5 | 8,701 | 27,727 | 133086,3 | 3429,2 | 11,2 | -1,8 | 3,2 | 13,2 |
5 | 26,2 | 15,6 | 408,7 | 10,665 | 50,946 | 471199,9 | 10708,5 | 14,1 | 1,5 | 2,3 | 11,0 |
6 | 27,5 | 12,1 | 332,8 | 10,984 | 40,102 | 571914,1 | 9150,6 | 14,6 | -2,5 | 6,3 | 18,8 |
7 | 30 | 16,3 | 489,0 | 11,568 | 55,440 | 810000,0 | 14670,0 | 15,6 | 0,7 | 0,5 | 5,1 |
8 | 37,3 | 16,7 | 622,9 | 13,097 | 60,437 | 1935687,9 | 23234,5 | 18,3 | -1,6 | 2,6 | 12,0 |
9 | 39,5 | 20,5 | 809,8 | 13,515 | 75,364 | 2434380,1 | 31985,1 | 19Д | 1,4 | 2,0 | 10,5 |
Итого | 225 | 121,2 | 3331,0 | 90,468 | 394,190 | 6552674,1 | 101251,3 | 121,2 | 0,0 | 25,6 | 96,0 |
Средняя | 25,0 | 13,5 |
|
|
|
|
|
|
| 2,8 | 10,7 |
Сигма | 9,12 | 4,04 | |||||||||
| 83,18 | 16,29 |
12. Проведём расчёт параметров степенной функции, которому также предшествует процедура линеаризации исходных переменных. В данном случае; выполняется логарифмирование обеих частей уравнения, в результате которого получаем уравнение, где линейно свя- заны значения логарифмов фактора и результата. Исходное уравнение У = <я0 * Х"х после логарифмирования приобретает следующий вид: 1пУ = 1пя0 +ах *1пX. Порядок расчёта приведён в таблице 6.
Расчётная таблица №6
№ | X | у факт. | \пХ | 1пУ | (\пХ)2 | 1пК*1пХ | 1п Урасч | а2\х\У | у л расч. | Ц§ |
А | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
1 | 11,6 | 7,3 | 2,4510 | 1,9879 | 4,8723 | 4,8723 | 2,0330 | 0,0020 | 7,6 | 2,5 |
2 | 14,8 | 9,3 | 2,6946 | 2,2300 | 6,0091 | 6,0091 | 2,2148 | 0,0002 | 9,2 | 1,0 |
3 | 19,0 | 14,0 | 2,9444 | 2,6391 | 7,7705 | 7,7705 | 2,4011 | 0,0566 | 11,0 | 22,0 |
4 | 19,1 | 9,4 | 2,9497 | 2,2407 | 6,6094 | 6,6094 | 2,4050 | 0,0270 | 11,1 | 12,5 |
5 | 26,2 | 15,6 | 3,2658 | 2,7473 | 8,9719 | 8,9719 | 2,6408 | 0,0113 | 14,0 | 11,7 |
6 | 27,5 | 12,1 | 3,3142 | 2,4932 | 8,2629 | 8,2629 | 2,6770 | 0,0338 | 14,5 | 18,1 |
7 | 30,0 | 16,3 | 3,4012 | 2,7912 | 9,4933 | 9,4933 | 2,7419 | 0,0024 | 15,5 | 5,8 |
8 | 37,3 | 16,7 | 3,6190 | 2,8154 | 10,1889 | 10,1889 | 2,9044 | 0,0079 | 18,3 | 11,5 |
9 | 39,5 | 20,5 | 3,6763 | 3,0204 | 11,1040 | 11,1040 | 2,9471 | 0,0054 | 19,1 | 10,8 |
Итого |
| 121,2 | 28,3162 | 22,9651 | 73,2824 | 73,2824 | 22,9651 | 0,1467 | 120,3 | 96,0 |
Средняя |
| 13,5 | 3,1462 | 2,5517 |
|
|
|
|
| 10,7 |
Сигма |
|
| 0,3914 | 0,3187 | ||||||
Э |
|
| 0,1532 | 0,1016 |
В результате расчёта получены следующие значения определителей второго порядка:
А | п * X 0п X)2 - 21п X * 21п X | 12,4075;
А1па0 =^\пУ*^(\пХ)2 ~^(ЫУ •1пЛ')*5>! 12,5371;
с Ля, =«*Х(1пГ*Л-^п7*5>Х = 9,25642.
Параметры степенной функции составляют:
! А1пйг0 2,5371 ЩШ Аа{ 9,25642
\па--1 —1-= 0,2045 а, = —IШ —-= 0,7460.
0 А 12,4075 А 12,4075
Уравнение имеет вид: 1пУ=1п а0 + а^Ы X = 0,2045 + 0,7460*Х, а после процедуры потенцирования уравнение приобретает окончательный вид:
||пг =е1па0 = ]0,2045 *еш™,7«о = 2,7182821па° *2,7182821п™.7460 или
^ = ал*Хй1 | 1,2269*Х°'7Ш .
Полученное уравнение несколько лучше описывает изучаемую зависимость и более надёжно по сравнению с линейной моделью. Степенная модель имеет детерминацию на уровне 84,0% (против 82,4% по линейной модели), Рфакт—^А (против 33,1 для линейной модели) и ошибку аппроксимации на уровне 10,7% (сравните с 10,9% для уравнения прямой).
Очевидно, что преимущества степенной модели по сравнению с линейной не столь значительны, но её построение заметно сложнее и требует значительно больших усилий. Поэтому окончательный выбор, в данном конкретном случае, сделаем в пользу модели, которая является более простой при построении, анализе и использовании, то есть в пользу линейной модели:
Ъх =3,415 + 0,402 *Х
Заключительным этапом решения данной задачи является выполнение прогноза и его оценка.
Если предположить, что прогнозное значение общей суммы доходов населения, например, Новгородской области, (см. табл.2 строка 2) возрастёт с 14,8 млрд. руб.на 5,7% и составит 15,6 млрд. руб., то есть X = Хпрогнозн-^ 14,8*1,057=15,6, тогда прогнозное значение резуль-
тата сформируется на уровне: У =Упрогнозн =3,415+0,402* 15,6=9,7 (млрд. руб.). То есть, прирост фактора на 5,7% приводит к приросту результата на 4,2 процента
9 7-93 97
( ШШт * 100% | ' ■ -100% 14,2%) . 9,3 9,3*100
Рассчитаем интегральную ошибку прогноза - Е^, которая формируется как|>умма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии-5у и ошибки прогноза положения регрессии - //^. То есть, Щ 1 ^82у +м2г •
В„3 _ X 0 факт. У расч.} 25,4
нашем случае 8 у ------= —■— = 3,6 , где /с- число факторов в уравнении,
п-к-1 9-1-1
которое в данной задаче равно 1. Тогда 5у - 1,9 (млрд. руб.).
/1 (X -X)2 II (X — X)2
Ошибка положения регрессии составит: -8^* ШШт--==^г = ^ * —*-— / щ
У 7 §§ Х№-1)2 У Щ п*а2
' =0,914 (млрд. руб.).
748,6
Интегральная ошибка прогноза составит: Еу~ = ^82г + /л2у = 7з,6+0,9142 = (млрд. руб.).
Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: АУ -1табличн *ЕГ I 2,365*2,1 = 5,011 | 5,0 (млрд. руб.). Табличное значение /-критерия для уровня значимости а=0,05 и для степеней свободы п-к-1 = 9-1-1=7 составит 2,365. (См. табл. приложения 2). Следовательно, ошибка большинства реализаций прогноза не превысит ± 5,0 млрд. руб.
Это означает, что фактическая реализация прогноза будет находиться в доверительном интервале у - У ± АУ . Верхняя граница доверительного интервала составит
утЮ1 = У + АУ = 9,7 + 5,0 = 14,7(млрд. руб.). Нижняя граница доверительного интервала составит: Гт1п = У- АУ I 9,7 - 5,0 = 4,7(млрд. руб.).
у
Относительная величина различий значений верхней и нижней границ составит: й 1 тах =
У гот
14 7
—— = ЗД2 раза. Это означает, что верхняя граница в 3,12 раза больше нижней границы, то 4,7
есть точность выполненного прогноза весьма невелика, но его надёжность на уровне 95% оценивается как высокая. Причиной небольшой точности прогноза является повышенная ошибка аппроксимации. Здесь её значение выходит за границу 5-7% из-за недостаточно высокой типичности линейной регрессии, которая проявляется в присутствии единиц с высокой индивидуальной ошибкой. Если удалить территории с предельно высокой ошибкой (например, Калининградскую область с г'= 14%), тогда качество линейной модели и точность прогноза по ней заметно повысятся.
Задача №2.
Выполняется изучение социально-экономических процессов в регионах Южного федерального округа РФ по статистическим показателям за 2000 год. 1|р оборот розничной торговли, млрд. руб.; X! - инвестиции 2000 года в основной капитал, млрд. руб.; Х2 - средний возраст занятых в экономике, лет Х3 - среднегодовая численность населения, млн. чел. Требуется изучить влияние указанных факторов на оборот розничной торговли.
Предварительный анализ исходных данных по 12 территориям выявил наличие двух территорию (Краснодарский край и Ростовская обл.) с аномальными значениями признаков. )ти территории должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных аномальных единиц.
При обработке исходных данных получены следующие значения: А) - линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -о: N■=10.
| У | ! | х^ | х3 |
У | 1 | 0,7938 | 0,2916 | 0,8891 |
§ | 0,7938 | 1 | 0,2994 | 0,6693 |
| 0,2916 | 0,2994 | 1 | 0,0113 |
*3 | 0,8891 | 0,6693 | 0,0113 | 1 |
Средняя | 8,878 | 5,549 | 38,79 | 1,160 |
а | 8,7838 | 5,1612 | 1,0483 | 0,90107 |
Б) - коэффициентов частной корреляции
| . у 1 | *1 | Х2 | хз |
У | 1 | 0,4726 | 0,5169 | 0,8511 |
1 | 0,4726 | 1 | 0,0521 | -0,0793 |
Х2 | 0,5156 | 0,0521 | 1 | -0,5598 |
*3 | 0,8^1 | -0,0793 | -0,5598 | 1 |
Задание:
1. По значениям линейных коэффициентов парной и частной корреляции выберите неколли-неарные факторы и рассчитайте для них коэффициенты частной корреляции. Произведите окончательный отбор информативных факторов во множественную регрессионную модель.
2. Выполните расчет бета коэффициентов (/3) и постройте с их помощью уравнение множественной регрессии в стандартизованном масштабе. Проанализируйте с помощью бета коэффициентов (/?) силу связи каждого фактора с результатом и выявите сильно и слабо влияющие факторы.
3. По значениям Д-коэффициентов рассчитайте параметры уравнения в естественной форме (то есть аь а2, и а0). Проанализируйте их значения. Сравнительную оценку силы связи факторов дайте с помощью общих (средних) коэффициентов эластичности - .
4. Оцените тесноту множественной связи с помощью К и Я2, а статистическую значимость уравнения и тесноту выявленной связи - через /^критерий Фишера (для уровня значимости а=0,05).
5. Рассчитайте прогнозное значение результата У% , предполагая, что прогнозные значения факторов (5су )составят 101,3 процента от их среднего уровня.
6. Основные выводы оформите аналитической запиской. Решение.
1. Представленные в условии задачи значения линейных коэффициентов парной корреляции позволяют установить, что оборот розничной торговли -У более тесно связан со среднегодовой численностью населения-Х3 (гуХз =0,889 \) и с инвестициями 2000 года в основной капитал - Х7 (г = 0,7938,); наименее тесно результат У связан со средним
возрастом занятых в экономике —Х2. Поэтому, в силу небольшой информативности фактора Х2, предполагаем, что его можно исключить из дальнейшего анализа. Проверим наши предположения с помощью анализа матрицы коэффициентов частной корреляции. Очевидно, что наиболее тесная связь результата У со среднегодовой численностью населения (г *ХЛ =0,8511) и примерно одинаково тесно связан результат с инвестициями ИНН =0,4726) и со средним возрастом занятых (гуХг* =0,5169). Поэтому для уточнения окончательного вывода выполним расчёт серии коэффициентов частной корреляции У с двумя возможными комбинациями факторных признаков: для У с Х1 и с Х3, а также для УсХ2нХ3.
Расчёты частных коэффициентов корреляции выполним по следующим формулам:
ЩЛ Гух3 ГХХХ2 0,7938-0,8891*0,6693 У : , = ■ . -- - 0,584
г Уз ГУХ1*ГХ,Х3 = 0,8891-0,7938*0,6693 _07д2
ЩШ УХз**'~У'-2^1)*о-'2зд)",/(,"0'
г Гхххъ~Гухх Гухъ _ 0,6693-0,7938*0,8891
Как видим, факторы X) и Х3, действительно, тесно связаны с результатом, а между собой практически не взаимодействуют
Расчёт аналогичных показателей по следующей паре факторов приводит к иным результатам:
ГУ*1 ВЯЕ *Г*2*з 0,2916-0,8891*0,0113
ух2*х3
■ I--1- ■ - с.............— ■ ■ . ■ - = и,о 1 э
р-г2уХз ЩИ ) - <УИ91*)*0 -о,о, р
= 0,926
= ГУ*3 ГУХ2*ГХ2Х3 = 0,8891 -0,2916 * 0,0113
*
Гх2хъ~Гух2 Гухг 0,0113 - 0,2916 * 0,8891 Й8
ХЛ У ^\-Г2уХ1У{1'Г1уХъ) л/0 - 0,2916 *)• (1 - 0,8891 *)
В данном случае, межфакторное взаимодействие оценивается как заметное ( (Мн ~ ~0,567) и по абсолютной величине сравнимо с теснотой связи розничного товарооборота со средним возрастом. Таким образом, первая из рассмотренных пар факторных признаков (X] и Х3) в большей мере отвечает требованиям, предъявляемым МНК к исходным данным и, в частности, к отсутствию межфакторного взаимодействия. Указанные обстоятельства позволяют использовать Х1 и Х3 в качестве информативных факторов уравнения множественной регрессии. 2. При построении двухфакторной регрессионной модели У = а0 +а1х1 +аъхъ воспользуемся для упрощения расчётов методом стандартизованных переменных. В этом случае исходное уравнение приобретает вид: (у =Рух{ ЩШ + /Зухз *(хъ. Выполним расчёт Р~
коэффициентов, используя значения известных по условию линейных коэффициентов парной корреляции. п гух1-гух3*гх1х3 0,7938-0,8891*0,6693 Ш!
Р—---=---~ и, Зои >
1 г2 1-0,66932
1—Г х\х3
о _ гух3 ~гух\ *гх[х3 0,8891-0,7938*0,6693 л-.0.
РщШ — а--;-- 0,648 •>
ух* 1 „2 1-0,66932
В результате получено уравнение в стандартизованном масштабе:
/,=0,360*^ + 0,648%з
Параметры данного уравнения представляют собой относительные оценки силы влияния каждого из факторов на результат. При увеличении инвестиций в основной капитал на одну сигму ЯВ (от своей средней) оборот розничной торговли увеличится на 0,360 своей сигмы (ау); с увеличением среднегодовой численности населения на результат увеличится на 0,648ау.Сравнивая /?-коэффициентов, определяем, какой из признаков влияет на результат сильнее, а какой - слабее. В данном случае увеличение розничного товарооборота происходит, прежде всего, под влиянием увеличения численности на-селения и в меньшей степени - в результате увеличения инвестиций в экономику региона.
3. Используя значения коэффициентов, можно рассчитать параметров уравнения в естественной форме:
4.
«1 = * — = 0,360*^ I 0,613; «3 = Л» * ~ = 0,648*щ6,328; 1 у 1 а 5,16 3 ^**3 а 0,901
«о ШЯ *^~«з *Д^ = 8,88-0,360*5,55-6,318*1,160 = -1,849. В конечном счёте, имеем уравнение: — — 1,849 + 0,613 * х1 Ц 6,318 * лг3. По значениям
коэффициентов регрессии можно судить о том, на какую абсолютную величину изменяется результат при изменении каждого фактора на единицу (от своей средней).
С увеличением инвестиций в экономику на 1 млрд. руб. розничный товарооборот увеличивается на 0,613 млрд. руб., с увеличением численности населения на 1 млн. чел. розничный товарооборот возрастает на 6,318 млрд. руб.
Но так как признаки-факторы измеряются в разных единицах, сравнивать значения их коэффициентов регрессии не следует. Точную оценку силы связи факторов с результатом дают коэффициенты эластичности и /? - коэффициенты.
4. Для сравнительной оценки силы связи выполним расчёт средних коэффициентов эластичности. С их помощью можно определить, на сколько процентов изменяется результат при изменении фактора на 1% (от своего среднего значения). В нашем случае расчёт показал, что влияние численности населения на розничный товарооборот оказалось более сильным по сравнению с влиянием инвестиций в экономику: с ростом численности населения на 1% розничный товарооборот увеличивается на 0,825%, а при увеличении инвестиций на 1% розничный товарооборот возрастает на 0,383%. Различия в силе влияния весьма значительны: первый фактор влияет на результат в два с лишним раза сильнее, чем второй. Поэтому регулирование величины розничного товарооборота через численность населения будет более результативным, чем через объём инвестиций в экономику региона.
— *\ 5 549 — 1160
Эух =в1 *-=!- = 0,613*^1 = 0,383; Эмс, =«3 *-^- = 6,318*-^- = 0,825. Ц 1 I 8,878 У 3 3 у 8,878
6. Тесноту выявленной зависимости розничного товарооборота от инвестиций в экономику
региона и от численности населения оценивают множественный коэффициент корреляции
и детерминации. Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и /? - коэффициентов. Кух = ^тгух.*рух.. В нашем случае 2-х факторной зависимости расчёт строится следующим образом:
Щ| - ^ухх *Рухх +гухз *рухъ = ,/0,7938*0,360+0,8891*0,648 = <Д§620 - 0,9285.
Я2ух]ХЗ =0,8620.
Как показали расчёты, установлена весьма тесная зависимость розничного товарооборота от численности населения и размеров инвестиций в экономику региона. Это означает, что 86,2% вариации розничного товарооборота определены вариацией данных факторов. Оставшиеся 13,8% вариации результата сформировались под влиянием прочих причин, роль которых незначительна. 1. Оценка статистической значимости или надёжности установленной формы зависимости, её параметров, оценок её силы и тесноты является важным этапом анализа результатов. Для выполнения оценки формулируется нулевая гипотеза, которая рассматривает предположе-ние о случаейной природе полученных результатов. То есть, н0 : «0 = «11 а3 = н уХ\хъ 10.
Для проверки выдвинутой нулевой гипотезы используется /г-критерия Фишера. Его фактическое значение определяется, исходя из соотношения факторной и останочной дисперсий и их степеней свободы: а\£г=*к и (1./.2~п-к-1; где: п —число изучаемых единиц; к — число ограничений, которые накладываются на исходные данные при расчёте данного показателя. Здесь к равно числу факторов уравнения, то есть к=2.
Р = К2ух1 * ■ факт Х-К2^ »-к-\
В нашем случае, когда рассматривается зависимость результата от двух факторов, расчёт выглядит следующим образом:
Р = ШЁ • | =°>Ш. 2 г,.219
факт. ■ п_к_{ ЩШ Ю-2-1 I
Фактическое значение критерия показывает, что детерминация, сформированная под воздействием двух изучаемых факторов, почти в 22 раза больше, чем детерминация, связанная с действием прочих причин. Очевидно, что подобное соотношение случайно сформироваться не может и является результатом влияния существенных, систематических факторов.
Для принятия обоснованного решения Гфшапич. сравнивается с Гришин; которое формируется случайно и зависит степеней свободы факторной |Ц = А') и остаточной ШЖ2 = п~н-1) дисперсий, а также от уровня значимости а=0,05. В нашем примере, где *£//=Л= 2 и (1/.2~п-к-1 = 10-2-1-7 при а=0,05 FwаfoI = 4,74. См. табл. приложения 1. В силу того, что Рфактич ~21,9> - 4,74, можно с высокой степенью надёжности отклонить нуле-
вую гипотезу, а в качестве альтернативы — согласиться с утверждением, что проверяемые параметры множественной регрессионной модели неслучайны, что коэффициенты уравнения и показатели тесноты связи не являются случайными величинами. 8. Техническая часть прогнозных расчётов по уравнению множественной регрессии сравнительно проста. Достаточно определить прогнозные значения каждого факторного признака Xj , подставить их в уравнение и выполнить с ними расчёт прогнозного значения результата - ур. При этом следует помнить, что требования к точности и надёжности прогноза предъявляют к используемой модели повышенные требования. В нашем случае, прогнозное значение каждого из факторов, то есть Н и Щй, получено на основе среднер величины: х1{ = хг * 1,013 = 5,549* 1,013 = 5,621. Щ =х3 * 1,013 = 1,160* 1,013 = 1,175.
После подстановки в уравнение получаем следующий результат:
УХ{ Щ1 Ш -#,849 + 0,613 * 5,621 + 6,318 * 1,17519,02 (млрд. руб.)
Если инвестиции в экономику региона возрастут до 5,621 млрд. руб., а численность населения составит 1,175 млн. чел, тогда следует ожидать, что розничный товарооборот возрастёт до 9,02 млрд. руб., то есть увеличится на 1,6% от своего среднего уровня.
Задача №3.
Для проверки рабочих гипотез (№1 и №2) о связи социально-экономических показателей в регионе используется статистическая информация за 2000 год по территориям Центрального федерального округа.
У] - стоимость валового регионального продукта, млрд. руб
У2 - среднемесячная начисленная заработная плата 1-го занятого в экономике, тыс руб. Х[ - инвестиции текущего, 2000, года в основной капитал, млрд. руб.; Хг - среднегодовая стоимость основных фондов в экономике, млрд. руб.; Хз -.доля занятых в экономике в общей численности населения, %; Рабочие гипотезы:
Предварительный анализ исходных данных по 18 территориям выявил наличие трёх территорий (г. Москва, Московская обл., Воронежская обл.) с аномальными значениями признаков. Эти единицы должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных аномальных единиц.
При обработке исходных данных получены следующие значения линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -о: N«=15.
Для проверки рабочей гипотезы №1. Для проверки рабочей гипотезы №2.
| Yi | Xi | х2 |
| §§ | 1 | Хз |
Yi | 1 | 0,8171 | 0,8498 | Y2 | 1 | 0,6043 | 0,6712 |
| 0,8171 | 1 | 0,7823 |
| 0,6043 | 1 | 0,2519 |
х2 | 0,8498 | 0,7823 | 1 | Х3 | 0,6712 | 0,2519 | 1 |
Средняя | 23,77 | 5,600 | 115,833 | Средняя | 1,5533 | 23,77 1 7,2743 | 44,23 |
о | 7,2743 | 2,4666 | 30,0303 | G | 0,2201 | 2,1146 |
Задание:
1. Составьте систему уравнений в соответствии с выдвинутыми рабочими гипотезами.
2. Определите вид уравнений и системы.
3. На основе приведённых в условии значений матриц коэффициентов парной корреляции, средних и средних квадратических отклонений:
■ определите бета коэффициенты (р) и постройте уравнения множественной регрессии в стандартизованном масштабе;
- дайте сравнительную оценку силы влияния факторов на результат;
- рассчитайте параметры а/, а2 и ао уравнений множественной регрессии в естественной форме;
- с помощью коэффициентов парной корреляции и р коэффициентов рассчитайте для каждого уравнения линейный коэффициент множественной корреляции (/?) и детерминации (Я2);
- цените с помощью Р-критерия Фишера статистическую надёжность выявленных связей.
4. Выводы оформите краткой аналитической запиской.
Решение:
1. В соответствии с выдвинутыми рабочими гипотезами о связи признаков составим систему уравнений. Коэффициенты при эндогенных переменных обозначим через Ь , коэффициенты при экзогенных переменных - через а. Каждый коэффициент имеет двойную индексацию: первый индекс - номер уравнения, второй - индивидуальный номер признака. Тогда:
1*1 = «10 + «11 *Х\ + «12 *Х2 1*2 =«20 I *21 * | + «23* *3
2. Особенность данной системы в том, что в первом уравнении факторы представлены перечнем традиционных экзогенных переменных, значения которых формируются вне данной системы уравнений. Во втором уравнении в состав факторов входит эндогенная переменная щт значения которой формируются в условиях данной системы., а именно, в предыдущем уравнении. Системы уравнений, в которых переменные первоначально формируются как результаты, а в дальнейшем выступают в качестве факторов, называются рекурсивными. Именно с подобной системой уравнений имеем дело в данной задаче.
3. Выполним расчёт /^-коэффициентов и построим уравнения множественной регрессии в стандартизованном масштабе. Для уравнения №1:
= 0,8171-0,8498*0,7Ш = 0,8498-0,8171*0,7823
ЩШ 1-0,78232 Щ 1-0,7823*
По полученным результатам построено уравнение в стандартизованном виде:
/Л 10,3925 * йс, + 0,5247 * (х2
По данным первого уравнения сделаем вывод, что инвестиции текущего года в основной капитал (Ща влияют на стоимость валового регионального продукта Щ] слабее, чем среднегодовая стоимость основных фондов щ в экономике (хг), ж т.к. Щ = 0,3925 </3Х2 =0,5247.
Второе уравнение можно построить на основе следующих результатов:
^ 06043 -0.6712 * 0,2519 = 0,6712-0,6043*0,2519
ИН 1-0,25192 11 1-0,25192
Второе уравнение в стандартизованной форме имеет вид: ($Уг- 0,4647 * Ш +0,5541 * Ш.
Из второго уравнения очевидно, что на уровень среднемесячной заработной палаты более сильное влияние оказывает доля занятых, и менее сильное — стоимость ВРП.
4. Расчёт параметров уравнения регрессии в естественной форме даёт следующие результа-
ты: д.. = Я . * ^ = 0,3925 *-^-^ = 1,15 11 ах 2,4666
о» 7 2743
«12 =Л, * —^0,5247* ' =0,13 °х2 30,0303
«ю = У ~ «п *I ~«12 *х2 = 23,77-1,15*5,6 - 0,13* 115,833 - 2,27. По полученным результатам построено уравнение №1 в естественной форме:
^ =2,27 + 1,15* 1 +0,13*л:2. Параметры уравнения №2 рассчитываются аналогичным образом. Но главная отличительная особенность их расчёта в том, что в качестве одного из факторов выступают не фактические значения у{, а его теоретические значения Щ, полученные расчётным путём при подстановке в уравнение № 1 фактических значений факторов х1 и х2. Указанным способом рассчитаны параметры рекурсивного уравнения:
0,554. ШЙШШШН 0.4547 * ШЁ 0,051 «20 =У2~ Щ *У\- «23 * *з = 1,5533 - 0,017 * 23,77 - 0,05 * 44,23= -1,06>. По полученным результатам построено уравнение №2 в естественной форме: ^2 = -1,<Ц +0,017*^ +0,05* х3.
Представим результаты построения уравнений в виде рекурсивной системы:
Г^, = 2,27 + 1,15 *х, +0,13*д:2 \)2 =-1,06 + 0,017*}, +0,05*л:3
Значения коэффициентов регрессии каждого из уравнений могут быть использованы для анализа силы влияния каждого из факторов на результат. Но для сравнительной оценки силы влияния факторов необходимо использовать либо значения 0 -коэффициентов, либо средних коэффициентов эластичности - ЭухХ^, ЭУхХг, Эух^ и Щж. 3. Для каждого из уравнений системы рассчитаем показатели корреляции и детерминации. $Щ = 71 Р*х> * гУ1х; = л/0,3925 * 0,8171 + 0,5247 * 0,8498 = Д767 = 0,876.
Яум | рУ1Ух*гуХ+Ругъ*Гу2Х> 1 л/0,4647* 0,6043 + 0,5541* 0,6712 = ^0^53 = 0,808. В первом уравнении факторы хх и х2 объясняют 76,7% вариации стоимости валового регионального продукта, а 23,3% его вариации определяется влиянием прочих факторов.
Во втором уравнении переменные уг и х3 объясняют 65,3% изменений заработной платы, а 34,7% изменений заработной платы зависят от прочих факторов. Обе регрессионные модели выявляют тесную связь результата с переменными факторного комплекса
6.Оценим существенность выявленных зависимостей. Для этого сформулируем нулевые гипотезы о статистической незначимости построенных моделей и выявленных ими зависимостей:
^о(1) ■' Я(о = 0 и Я0(2) : Я(2) 10. Для проверки нулевых гипотез используется ^-критерий Фишера. Выполняется расчет его фактических значений, которые сравниваются с табличными значениями критерия. По результата сравнения принимается решение относительно нулевой гипотезы. В нашей задаче:
V = ЁЯ • * = 0/767 ■ 2 =,107- Р = °'653 - 2 -1п
*».(!) {_кг{х)-п_к_х 1-0,767 15-2-1 '' г*""-(2> 1 _ 0?653 12 Ш
Табличные значения /^-критерия формируются под влиянием случайных причин и зависят от трёх условий: а) от числа степеней свободы факторной дисперсии - а'./., = к, где к 1 число факторных переменных в модели; б) от числа степеней свободы остаточной дисперсии - й./.2 | п - к -1, где п - число изучаемых объектов; в) от уровня значимости а, который определяет вероятность допустить ошибку, принимая решение по нулевой гипотезе. Как правило, значение а берут на уровне 5% (а =0,05), но при высоких требованиях к точности принимаемых решений уровень значимости составляет 1% (а =0,01) или 0,1% ((а =0,001).
Значения Р^бл. представлены в таблице «Значения /^-критерия Фишера». (См. приложение 1 данных «Методических указаний...»).
В рассматриваемой задаче Г^,^ для а./. х -к-2, 4./.2 =п-к-1 = 15-2-1 = 12 и а =0,05 соствляет 3,88. В силу того, что РфактХ]) -19,7 > =3,88 нулевую гипотезу о статистической незначимости характеристик уравнения №1 следует отклонить, то есть Я0(1) => (-). Аналогичное решение принимается и относительно второй нулевой гипотезы, т.к.
рфакт{2) = П,3 > РтаГ>л = 3,88. То есть, Я0(2) => (-).Отклоняя нулевую гипотезу, допустимо (с определённой степенью условности) принять одну из альтернативных гипотез. В частности, может быть рассмотрена и принята гипотеза о том, что параметры моделей неслучайны, то есть формируются под воздействием представленных в моделях факторов, влияние которых на результат носит систематический, устойчивый характер. Это означает, что полученные результаты могут быть использованы в аналитической работе и в прогнозных расчётах среднемесячной заработной платы и стоимости валового регионального продукта, которые основаны не только на влиянии хьх2,х3, но и на влиянии эндогенной переменной у\. Рекурсивные модели связей предоставляют возможность подобного анализа и прогноза.
Задача №4.
Предлагается изучить взаимосвязи социально-экономических характеристик региона за период.
V! - инвестиции текущего года в экономику региона, млрд. руб. У2 - стоимость продукции промышленности и АПК в текущем году, млрд. руб. Уз - оборот розничной торговли в текущем году, млрд. руб. XI - инвестиции прошлого года в экономику региона, млрд. руб. х2 - среднегодовая стоимость основных фондов в экономике региона, млрд. руб. х3 - среднегодовая численность занятых в экономике региона, млн. чел. Приводится система рабочих гипотез, которые необходимо проверить.
Г 7, = /(У2,х1,х2,х3); |г2=ДГ1?*2,*3); .
Задание
1. Используя рабочие гипотезы, постройте систему уравнений, определите их вид и проведите их идентификацию.
2. Укажите, при каких условиях может быть найдено решение каждого из уравнений и системы в целом. Дайте обоснование возможных вариантов подобных решений и аргументируйте выбор оптимального варианта рабочих гипотез.
3. Опишите методы, с помощью которых будет найдено решение уравнений (косвенный МНК. двухшаговый МНК).
Решение.
1. В соответствии с предложенными рабочими гипотезами построим график, отображающий связи каждой из представленных переменных с другими переменными. См. рис. 2. Отличительной особенностью уравнений системы является наличие прямых и обратных зависимостей между переменными Уь У? и К> Указанная особенность характерна для так называемых структурных уравнений. В состав структурных уравнений входят: а) эндогенные переменные (У), значения которых формируется в условиях данной системы признаков и их взаимозависимостей и б) экзогенные переменные (х„), значения которых формируются вне данной системы признаков и условий, но сами экзогенные переменные участвуют во взаимосвязях данной системы и оказывают влияние на эндогенные переменные. Коэффициенты при эндогенных переменных обозначаются через ат,., коэффициенты при экзогенных переменных обозначаются через , где /-число изучаемых объектов; т ~ число экзогенных переменных, которые обычно обозначают через х; /- число эндогенных переменных, обычно обозначаемых через У. Таким образом, в каждом уравнении системы каждый коэффициент при переменной имеет двойную индексацию: I) - номер эндогенной переменной, расположенной в левой части уравнения и выступающей в качестве результата; 2) - номер переменной, находящейся в правой части уравнения и выступающей в качестве фактора.
В пашей задаче система уравнений для описания выдвигаемые рабочие гипотезы будет иметь следующий вид:
(У{ = ап *У2+Ьп*х1+Ь12*хг+ Ьп * *3
У 2 = «21**1 + ^22**2+^23**3
Выполним идентификацию каждого структурного уравнения и всей системы для ответа на вопрос - имеют ли решения каждое из уравнений и система в целом. Воспользуемся счётным правилом, по которому в каждом уравнении системы необходимо сравнить число эндогенных переменных в данном уравнении - Ун и число отсутствующих в уравнении экзогенных переменных из общего для всей системы их перечня - х0. Для удобства анализа представим результаты в таблице.
Результаты идентификации структурных уравнений и всей системы.______
Номер уравнения
Число эндогенных переменных в у равн ении, И
Число экзогенных переменных из общего их списка, отсутствующих в уравнении,/)__
Сравнение параметров #и/)+/
о
2>0+1
1
2= 1+1
Решение об идентификации уравнения
Неидентифицировано
Точно идентифицировано
3<3+1
С верх идентифицировано
Вся система уравнений в целом
Неидентифицирована
I. В том случае, когда хотя бы одно из уравнений не имеет решения, система в целом также не имеет решения. Если подобный результат нас не устраивает, необходимо внести коррективы в исходные рабочие гипотезы и отредактировать их таким обра-юм, чтобы идентификация была возможна.
4. Теоретический анализ содержания взаимосвязи, отражённой в уравнении №1, позволяет рассмотреть варианты возможной корректировки. Во-первых, из правой части может быть исключена одна из экзогенных переменных. Скорее всего, ею может оказаться х3 - среднегодовая численность занятых в экономике региона, (млн. чел.), так как по своему экономическому смыслу она менее тесно связана с инвестициями, чем инвестиции прошлого года (х^) и среднегодовая стоимость основных фондов в экономике региона, (х>).
Во-вторых, возможна корректировка путём исключения из правой части уравнения эндогенной переменной У2 - стоимость продукции промышленности и АПК в текущем году, млрд. руб. Но в этом случае, уравнение перестанет быть структурным, следовательно, изучить обратную связь Г/ и У2 будет невозможно. По этой причине подобная корректировка является нецелесообразной.
При корректировке рабочей гипотезы путём удаления х3 уравнение №1 становится точно идентифицированным, а вся система - сверхидентифицированной.
5. Для поиска решений сверхидентифицированной системы уравнений применяются: а) косвенный метод наименьших квадратов (КМНК) для решения точно идентифицированных уравнений и б) двухшаговый МНК (ДМНК) для поиска решений сверхидентифицирован-ных уравнений.
Задача №5.
По территориям Центрального федерального округа России имеются данные за 2000 год о следующих показателях: У1 - ваповой региональный продукт, млрд. руб. У 2 - розничный товарооборот, млрд. руб.
- основные фонды в экономике, млрд. руб.
х2 - инвестиции в основной капитал, млрд. руб.
х3~ численность занятых в экономике, млн. чел.
х4 - среднедушевые расходы населения за месяц, тыс. руб.
Изучения связи социально-экономических показателей предполагает проверку следующих рабочих гипотез:
*2 =/(^1 »*1 >*з )•
Для их проверки выполнена обработка фактических данных и получена следующая система приведённых уравнений:
У, = -14,82 +0,053 **« +0,747**- + 0,023 *х, + 12,88* х,;К2 =0,863;^, .=15,7.
1 1 2 3 4' ' фактический
2
| Щ -6,34 + 0,020 * хх + 0,069 * *2 + 0,011 * х^ + 8,29 * *4; Я 2 = 0,874; Р^
тактический '
Задание:
1. Построить систему структурных уравнений и провести её идентификацию;
2. Проанализировать результаты решения приведённых уравнений;
3. Используя результаты построения приведённых уравнений, рассчитать параметры структурных уравнений (косвенный МНК); проанализировать результаты;
4. Указать, каким образом можно применить полученные результаты для прогнозирования эндогенных переменных Ух и У2.
Решение.
1. Построение системы структурных уравнений выполняется в соответствии с рабочими гипотезами:
У, = ах ~ * У~ + Ьл * * хл + Ь
42
11 Л1
'12
13
[У2 = а21 *У1 +Ь2\ Щ +Ь23 *х3 + Ь24 % 2. В соответствии со счётным правилом оба уравнения и система в целом являются точно идентифицированными и это означает, что они имеют единственное решение, которое мо-
Номер уравнения | Число эндогенных переменных в уравнении,Н | Число экзогенных переменных из общего их списка, отсутствующих в уравнении,В | Сравнение параметров Я и 0+1 | Решение об идентификации уравнения |
1 | 2 | 1 | 2 = 1+1 | точно идентифицировано |
2 | 2 | 1 | 2=1+1 | точно идентифицировано |
Система уравнений в целом | точно идентифицирована |
3. Процедура КМНК состоит в том, чтобы путём преобразования результатов решения приведённых уравнений получить искомые структурные уравнения. Используемый приём подстановок обеспечивает получение точных результатов только в том случае, если выполняемые преобразования точны и безошибочны. Чтобы получить перв^е структурное уравнение из первого приведённого необходимо отсутствующий в структурном уравнении признак х4 выразить через У2, используя результаты второго приведённого уравнения. То есть:
У2 + 6,34 - 0,02дД 0,07 * *3 - 0,011 * *3
*4 =
8,29
46
После подстановки значения х4 в первое приведённое уравнение и преобразования подобных членов, получаем следующий результат: 1 = -14,8 + 0,053*^ + 0,78 * л2 +0,023 *д;3+12,8
У2 +^34-0,02*^ -0,07**2 -0,011**^ 8,29
х2 =
| -4,95 + 1,55 * У2 + 0,023 * х{ + 0,67 * х2 + 0,006 * *3.
Как видим, полученный результат соответствует исходной рабочей гипотезе. Анализ показывает, что стоимость ВРП находится в прямой зависимости от розничного товарооборота, стоимости основных фондов в экономике, от размера инвестиций в экономику и от численности населения, занятого в экономике региона. Указанные переменные объясняют 86,3% вариации результата, а характеристики установленной зависимости являются статистически значимыми и надёжными, так как
ШШШШШШШ для Щ =4;Л/.2=15-4-1 = 10;а = 0,05. Следовательно, есть основания для отклонения нулевой гипотезы о случайной природе выявленной зависимости.
Аналогично выполняем преобразования для определения параметров второго структурного уравнения. Выразим отсутствующий в уравнении х2 через У/, используя результаты построения первого приведённого уравнения. То есть:
У{ + 14,82 - 0,053 * ^ - 0,023 * *3 - 12,88 * *4
0,747
После подстановкщЬначения х2 во второе приведённое уравнение и преобразования подобных членов получаем следующий результат:
Щ +14,82-0,053*х1 -0,023**3 - 12,88**Л 0,747 ~)
= -4,97 + 0,092 * У{ + 0,015 * ^ + 0,0089 * *3 + 7,1 * *4.
Уравнение описывает линейную зависимость розничного товарооборота от стоимости ВРП, основных фондов в экономике, от численности занятых в экономике и от уровня среднедушевых расходов населения за месяц. Данный перечень переменных объясняет 87,4% вариации оборота розничной торговли, а соотношение ^фактич ~^'^> ^табл = ^Л% позволяет отклонить нулевую гипотезу о случайной природе выявленной зависимости. 4. Для выполнения прогнозных расчётов У] и У2 наиболее простым является вариант, по которому прогнозные значения экзогенных переменных (x^^) подставляются в приведённые уравнения. Точность и надёжность прогнозов в этом случае зависит от качества приведённых моделей и от того, как сильно отличаются прогнозные значения экзогенных переменных от их средних значений.
Задача №6.
Среднегодовая численность занятых в экономике Российской Федерации, млн. чел., за
У2 I -6,34 + 0,02 * х1 + 0,|
,069*
Годы | А | Годы | 1 |
1990 | 75,3 | 1995 | 66,4 |
1991 | 73,8 | 1996 | 66,0 |
1992 | 72,1 | 1997 | 64,7 |
1993 | 70,9 | 1998 | 63,8 |
1994 | 68,5 | 1999 | 64,0г |
|
| 2000 | 64,3 |
Задание:
1. Постройте график фактических уровней динамического ряда -С^
2. Рассчитайте параметры параболы второго порядка : <2г - а0 + а} * (+ а2 * (2 линейной : 0( = а0 +ах *( и логарифмической функций : 0, = а0 + ах * 1п/
3. Оцените полученные результаты:
- с помощью показателей тесноты связи ( р и р2);
- значимость модели тренда (Т-критерий);
- качество модели через корректированную среднюю ошибку аппроксимации ё', а также через коэффициент автокорреляции отклонений от тренда -
4. Выберите лучшую форму тренда и выполните по ней прогноз до 2003 года.
5. Проанализируйте полученщре результаты.
Решение:
1. Общее представление о форме основной тенденции в уровнях ряда даёт график их фактических значений. Для его построения введём дополнительные обозначения для комплекса систематически действующих факторов, который по традиции обозначим через I и условно отождествим с течением времени. Для обозначения комплекса систематических факторов используются числа натурального ряда: 1, 2, 3, ...,п. См. табл. 1. В первую очередь выявим линейный тренд и проверим его статистическую надёжность и качество. Параметры рассчитаем с помощью определителей второго порядка, используя формулы, рассмотренные нами в зад. 1. Получены значения определителей: А = 1210; Аа0 =91322; Да, =-1474. С их помощью получены следующие параметры линейного тренда: а0 = 75,47 ; ах = -1,2182, уравнение имеет вид: (3, = 75,47 -1,2182 * /. Уравнение детер-
316
минирует 92,2% вариации численности занятых (гц1 = 1,2182 * = 0,96; = 0,922 ).
Таблица 1.
Годы | 1 | Т |
|
| 0,1 расч. |
| ш2 | | |
А | 1 | 2 | 3 | 4 | 5 | 6 | 1 | 8 |
1990 | 75,3 | 1 | 1 | 75,3 | 74,3 | 1,0 | 1,0 | 1,5 |
1991 | 73,8 | 2 | 4 | 147,6 | 73,0 | 0,8 | 0,6 | 1,1 |
1992 | 72,1 | 3 | 9 | 216,3 | 71,8 | 0,3 | 0,1 | 0,4 |
1993 | 70,9 | 4 | 16 | 283,6 | 70,6 | 0,3 | 0,1 | 0,4 |
1994 | 68,5 | 5 | 25 | 342,5 | 69,4 | -0,9 | 0,8 | 1,3 |
1995 | 66,4 | 6 | 36 | 398,4 | 68,2 | -1,8 | 3,2 | 2,6 |
1996 | 66,0 | 7 | 49 | 462,0 | 66,9 | -0,9 | 0,8 | 1,4 |
1997 | 64,7 | 8 | 64 | 517,6 | 65,7 | -1,0 | 1,0 | 1,5 |
1998 | 63,8 | 9 | 81 | 574,2 | 64,5 | -0,7 | 0,5 | 1,0 |
1999 | 64,0 | 10 | 100 | 640,0 | 63,3 | 0,7 | 0,5 | 1,0 |
2000 | 64,3 | 11 | 121 | 707,3 | 62,1 | 2,2 | 4,8 | 3,3 |
Итого | 749,8 | 66 | 506 | 4364,8 | 749,8 | 0,0 | 13,4 | 15,6 |
Средняя | 68,2 | 6,0 | — | — | — | — |
| 1,4 |
Сигма | 4,01 | 3,16 | — | — | — | — | — |
|
Дисперсия, В | 16,08 | 10,0 | — | — | — | — | — | — |
Средняя ошибка аппроксимации ё1 очень невелика (ё1 — 1,4%), что указывает на высокое качество модели тренда и возможность её использования для решения прогнозных задач. Фактическое значение /^-критерия составило 108 и сравнение с 5,12 его табличного значения позволяет сделать вывод о высокой степени надёжности уравнения тренда. Для дополнительной проверки качества тренда выполним расчёт коэффициента корреляции отклонений фактических уровней от рассчитанных по уравнению тренда. Если будет установлено отсутствие связи отклонений, это укажет на их случайную природу, то есть на то, что тренд выбран верно, что он полностью исключил основную тенденцию из фактических уровней ряда и что он сформировал случайный значения отклонений. Выполним расчёт в табл.2. Поместим во второй графе фактические отклонения от тренда , для удобства расчёта обозначим их через Г. В соседней графе поместим эти же отклонения, но, сместив их относительно первой строки на один год вниз; обозначим их через 1 и рассмотрим в качестве фактора X. Линейный коэффициент корреляции отклонений рассчитаем по формуле: I = с, *
Щ
Используем значения определителей второго порядка для расчёта коэффициента регрессии С/, который отражает силу связи отклонений */<2, и <М2хЛ. Получены следующие значения определителей:
Л = 10*8,6-(-2,2) * (-2,2) = 81,2 Дс, =10* 6,6 - (-1,0) * (-2,2) = 63,8 63 8
Отсюда с, = —— =0,786. При этом, коэффициент корреляции отклонений составит:
81,2
:Щ ^,=0,7*6*^ = 0.643 ШИВ ^ =^:_1_,.5>бЗ 1к^|
В данном случае выявлена заметная связь, существенность которой подтверждает сравнение фактического и табличного значений Г- критерия: = 5,63 > Р11иЛЯш =5,32. Следовательно, нулевая гипотеза о случайной природе отклонений не может быть принята, отклонения связаны между собой и не являются случайными величинами. То есть, линейный тренд не полностью исключил из фактических уровней влияние систематических факторов, формирующих основную тенденцию. Следует рассмотреть тренд иной формы.
|
| (X) |
|
|
| 1,0 | — | — | — |
1 | 0,8 | 1,0 | 0,8 | 1,0 |
2 | 0,3 | 0,8 | 0,2 | 0,6 |
3 | 0,3 | 0,3 | 0,1 | 0,1 |
4 | -0,9 | 0,3 | -0,3 | 0,1 |
5 | -1,8 | -0,9 | 1,6 | 0,8 |
6 | -0,9 | -1,8 | 1,6 | 3,2 |
7 | -1,0 | -0,9 | 0,9 | 0,8 |
©0 | -0,7 | -1,0 | 0,7 | 1,0 |
9 | 0,7 | -0,7 | -0,5 | 0,5 |
10 | 2,2 | 0,7 | 1,5 | 0,5 |
Итого | -1,0 | -2,2 | 6,6 | 8,6 |
Средняя | -ОД | -0,2 | — | — |
Сигма | 1,12 | 0,91 | — | — |
2. Рассмотрим возможность использования для описания тренда равносторонней гиперболы: б, = я0 | «1 * - • В качестве аргумента в уравнении тренда здесь выступает 1. Выполним расчет параметров и оценим полученное уравнение. См. табл. 3.
Таблица 3
Годы | I | 1 1 | В | 1 I2 | б расч. ' | 3 |
| | |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 00 | 9 |
1990 | 75,3 | 1,000 | 75,300 | 1,0000 | 77,8 | -2,5 | 6,3 | 3,7 |
1991 | 73,8 | 0,500 | 36,900 | 0,2500 | 71,2 | 2,6 | 6,8 | 3,9 |
1992 | 72,1 | 0,333 | 24,033 | 0,1111 | 68,9 | 3,2 | 10,2 | 4,6 |
1993 | 70,9 | 0,250 | 17,725 | 0,0625 | 67,8 | ЗД | 9,6 | 4,5 |
1994 | 68,5 | 0,200 | 13,700 | 0,0400 | 67,2 | 1,3 | 1,7 | 2,0 |
1995 | 66,4 | 0,167 | 11,067 | 0,0278 | 66,7 | -о,з | 0,1 | 0,5 |
1996 | 66,0 | 0,143 | 9,429 | 0,0204 | 66,4 | -0,4 | 0,2 | 0,6 |
1997 | 64,7 | 0,125 | 8,088 | 0,0156 | 66,2 | -1,5 | 2,2 | 2,2 |
1998 | 63,8 | 0,111 | 7,089 | 0,0123 | 66,0 | -2,2 | 4,8 | 3,2 |
1999 | 64,0 | 0,100 | 6,400 | 0,0100 | 65,8 | -1,8 | 3,2 | 2,7 |
2000 | 64,3 | 0,091 | 5,845 | 0,0083 | 65,7 | -1,4 | 2,0 | 2,1 |
Итого | 749,8 | 3,020 | 215,575 | 1,5580 | 749,8 | 0,0 | 47,1 | 29,9 |
Средняя | 68,16 | 0,275 | — | — | — | — | 4,3 | 2,7 |
Сигма | 4,01 | 0,257 | — | — | — | — |
|
|
| 16,08 | 0,066 | — | — | — | — | — | — |
Определители составили: А = 8,019; Аа0 =517,2; Да, =107,03. По их значениям рассчитаны параметры и получено уравнение тренда: =64,5 + 13,35*-. Уравнение тренда выявляет тенденцию постепенного снижения и сохранения на неизменном уровне численности занятых. Индекс корреляции оценивает выявленную связь как тесную:
= 1-
остаточная
\г\!ао ~ л/0,733 = 0,856 (см. гр. 7 и 8). Здесь изменения численности у 16,08
занятых на 73,3% определены изменениями систематических факторов, а на 26,7% - про- чими причинами. Ошибка аппроксимации очень невелика ё1 =2,7% (гр. 9) и поэтому возможности дальнейшего использования модели будут зависеть от оценки корреляции отклонений.
Коэффициент корреляции отклонений (коэффициент автокорреляции) выявил их заметную связь (Р^е=0,593), которая является статистически незначимой: Рфакт. ~ 4,32 < Ртабл. 15,32, то есть нулевая гипотеза Я0 : р-а{ =0 может быть принята с 5%-ой вероятностью допустить ошибку. Таким образом, имеются веские основания для использования модели равносторонней гиперболы для выполнения прогнозных расчётов.
При выполнении прогнозов на 2001, 2002, 2003 и 2004 годы подставим в уравнение прогнозные значения фактора, 7 - 12, 13, 14, 15, что позволяет получить результат на уровне 65,6 - 65,4 млн. чел.: Ст^п 165,6; 67=13 = 65,5; бг=н = 65,5; (?г=15 = 65,4. В данном прогнозе реализуется гипотеза о стабилизации численности занятых и её" сохранении на уровне 65,4 млн. чел.
3. Рассмотрим возможность использования показательной кривой для описания тенденции и прогноза. Показательная форма тренда имеет вид <2( =а0 * а{ и предполагает выполнение процедуры линеаризации исходного уравнения с целью приведения его к линейному виду. \х\<21 =1па0 +**1па,. В расчёте параметров полученного линейного уравнения участвуют значения 1п{2, и I. Порядок расчёта представим в табл. 4. Расчёт определителей второго порядка даёт следующие результаты:
А = п*^12 -5>*2> = 11*506-66*66 = 1210 Л 1п «о -X1п I * 111 ~ 10п <2 * 0 *Е (= 46,422 * 506 - 276,587 * 6615234,8 Л1гш, =и*Е0пе*0-5>е *2> = П* 276,587- 46,422 * 66 =-21,4 По ним рассчитаны параметры линеаризованной функции:
1па° "~ 1210 = 4,326; >пд1 = 1210 "~°'°177 и построено уравнение: 1п(), = 4,326-0,0177*г. Для получения уравнения в естественной форме выполним процедуру потенцирования результатов: | е4'326-0'0177*' 175,6 * 0,9825'.
| Таблица 4 | ||||||||||
Годы | 1 |
| / |
| 1пб, *< |
|
|
| @1расч. |
|
|
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
1990 | 75,3 | 4,321 | 1 | 1 | 4,321 | 4,309 | 0,013 | 0,00017 | 74,3 | 1,0 0,8 "* 0,3 | 1,4 1 0,5 |
1991 | 73,8 | 4,301 | 2 | 4 9 | 8,603 | 4,291 | 0,010 | 0,00010 | 73,0 71,8 | ||
1992 | 72,1 | 4,278 | 3 | 12,834 | 4,273 | 0,005 | 0,00003 | ||||
1993 | 70,9 | 4,261 | 4 | 16 | 17,045 | 4,256 | 0,006 | 0,00004 | 70,5 | 0,4 | 0,6 |
1994 | 68,5 | 4,227 | 5 | 25 | 21,134 | 4,238 | -0,011 | 0,00012 | 69,3 | -0,8 | 1,1 2^4 1.3 " 1.4 " , у 0,9 |
1995 | 66,4 | 4,196 | 6 | 36 | 25,174 | 4,220 | -0,025 | 0,00063 | 68,0 | -1,6 | |
1996 | 66,0 | 4,190 | 7 | 49 | 29,328 | 4,203 | -0,013 | 0,00017 | 66,9 | -0,9 | |
1997 | 64,7 | 4,170 | 8 | 64 | 33,358 | 4,185 | -0,015 | 0,00023 | 65,7 | -1,0 | |
1998 | 63,8 | 4,156 | 9 | 81 | 37,402 | 4,167 | -0,011 | 0,00012 | 64,5 | -0.7 0,6 | |
1999 | 64,0 | 4,159 | 10 | 100 | 41,589 | 4,149 | 0,009 | 0,00008 | 63,4 | ||
2000 | 64,3 | 4,164 | 11 | 121 | 45,799 | 4,132 | 0,032 | 0,00102 | 62,3 | 2,0 | 3,0 " |
Итого | 749,8 | 46,422 | 66 | 506 | 276,587 | 46,422 | 0^0_ | 0,00271 | 749,7 | 0,102 | 37 1,3 |
Средняя | 68,16 | 4,220 | 6 | —- | — | _ |
| 0,00025 | — |
| |
Сигма | 4,01 | 0,0581 | 3,162 | — | — | — | |||||
и | 16,08 | 0,00337 | 10,00 | — | — | _ | _ | __ |
|
|
|
показательный трено установил, что численность занятых сокращается со среднегодовым темпом, равным 0,9825 или 98,3%. За период 1990-2001 гг. численность занятых ежегодно уменьшалась в среднем на 1,7%.
В данном случае, показатели тесноты изучаемой связи рассчитываются не как обычно - на фактических и расчётных значениях результата (<2факт и (2расч), а с использованием линеаризованных значений результата ^(2^^ и \ъ0,1расч, потому что именно для них выполняется требование МНК о наименьшей сумме квадратов отклонений. Расчёт выполнен в гр.8 и 9. 11|
Выявлена весьма тесная зависимость численности занятых от комплекса систематических
1 1, ^ остаточная \пи I 0,00025 1 ггтт-гг ____
факторов: р1пд = 11--1-— = |1 —--= л/0,9258 = 0,962. Уравнение и его пара-
у &'общаяЫО. ' 0,00337
метры статистически значимы и надёжны, т.к. Г факт-ШН что значительно превосходит ^^.=5,12 (при а\/ч=1; 0.^11-1-1^9; «=0,05).
Средняя ошибка аппроксимации в данной задаче рассчитывается как обычно, с использованием <2факт и <2расч, т. к. при решении прогнозных задач производится оценка естественных, а не линеаризованных значений результата. Ошибка мала: гг/=1,3% и поэтому модель может быть рекомендована для использования при прогнозировании. При этом, важно убедиться, что после выявления тренда формируются отклонения с1\п<2( = \п()фа1(т -\ъ<2расч , представляющие собой зн#*ения случайной переменной.
Для этого рассчитаем коэффициент автокорреляции отклонений: гЫ1пд(аУп<2 = с1 * </1п^-1 .
Расчёт выполняется по линеаризованным значениям результата, то есть, с использованием с!ыв( = \пОфакт -\пОрасч и <Ппем.
Необходимая для расчёта информация представлена в табл. 5.
По аналогии с предыдущими расчётами определим коэффициент автокорреляции через определители второго порядка для двух рядов отклонений: с11п6, и 0\^(_х.
А = 10 * 0,00166 - (-0,032) * (-0,032) 10,0155852; Асх = 10 * 0,00129 - (-0,013) * (-0,032) 10,0125022;
^^^^к!I=ёшш=°'8о22;^,п^=од)
НИДВ = 0,8022 * оЩё=0,6342; ИИ= °>4°23 | й§Ы
Таблица 5
| <*1пС, (У) | <*1пем (X) |
|
|
| 0,013 | — | — | — |
1 | 0,010 | 0,013 | 0,00013 | 0,00016 |
2 | 0,005 | 0,010 | 0,00005 | 0,00011 |
3 | 0,006 | 0,005 | 0,00003 | 0,00002 |
4 | -0,011 | 0,006 | -0,00006 | 0,00003 |
5 | -0,025 | -0,011 | 0,00027 | 0,00012- |
6 | -0,013 | -0,025 | 0,00032 | 0,00060 |
7 | -0,015 | -0,013 | 0,00019 | 0,00017 |
00 | -0,011 | -0,015 | 0,00017 | 0,00023 |
9 | 0,009 | -0,011 | -0,00011 | 0,00013 |
10 | 0,032 | 0,009 | 0,00030 | 0,00009 |
Итого | -0,013 | -0,032 | 0,00129 | 0,00166 |
Средняя | -0,0013 | -0,0032 | — | — |
Сигма | 0,01579 | 0,0124841 | — | — |
| 0,0002493 | 0,0001559 | — | — |
Отклонения от показательного тренда находятся в заметной зависимости, которая, по оценке ^-критерия, является статистически значимой и надёжной: Рфакт. и 5А > Ртабя. ~ 5'321 Нулевая гипотеза о несущественной связи отклонений должна быть отвергнута с 5%-ой вероятностью ошибки. Это означает, что показательный тренд не является лучшим, т.к. не аккумулирует в себе влияния всего комплекса существенных факторов, а оставляет часть этого влияния в отклонениях от тренда. Поэтому показательный тренд не следует рассматривать как лучший. 4. Остановимся на порядке построения и использования степенной модели в решении поставленных задач. В данной модели реализуется концепция мультипликативного механизма воздействия фактора на результат: <2( -а0*1Ох. Построению модели предшествует процедура линеаризации исходного уравнения путём логарифмирования его элементов: 1п(2, = 1пд0 +а{ *1п/. В расчёте параметров участвуют 1пб, и \п(. Необходимая для расчёта исходная и промежуточная информация представлена в табл. 6. Расчёт определителей приводит к следующим результатам:
А = п * X Я/)2 - X 1л | * 21пI=11 * 33,400 -17,502 * 17,502 = 61,08' А 1п а0 = X 1п 0,г * X (1п I)2 - X (1п (2, * 1п 0 * X 1п * = 46,422 * 33,4 - 73,424 * 17,502 = 265,4; - п * X (1пб/ * 1п 0 - X1 б/ * X ш Щ 11 * 73>424 - 4М22 * 17,502 = -4,8. Значения параметров линеаризованного уравнения составят:
265 4 - 4 8
1ла0=^^ = 4,35; а, = —^- = -0,079, 0 61,08 ! 61,08
а уравнение линейное в линейной форме имеет вид:
1пб, =4,35-0,079* 1л г.
_______| Таблица 6
Годы | т | НИ | (1п02 | ы*1п<2, |
| ^1пб, | («Ппб,)2 |
1 | 2 | 3 | 4 | 5 | 6 | 7 | оо |
1990 | 0,000 | 4,321 | 0,000 | 0,000 | 4,346 | -0,025 | 0,00063 |
1991 | 0,693 | 4,301 | 0,480 | 2,981 | 4,291 | 0,010 | 0,00010 |
1992 | 1,099 | 4,278 | 1,207 | 4,700 | 4,259 | 0,019 | 0,00036 |
1993 | 1,386 | 4,261 | 1,922 | 5,907 | 4,236 | 0,025 | 0,00063 " |
1994 | 1,609 | 4,227 | 2,590 | 6,803 | 4,219 | 0,008 | 0,00006 |
1995 | ; 1,792 | 4,196 | 3,210 | 7,518 | 4,204 | -0,009 | 0,00008 |
1996 | 1,946 | 4,190 | 3,787 | 8,153 | 4,192 | -0,002 | 0,00000" |
1997 | 2,079 | 4,170 | 4,324 | 8,671 | 4,182 | -0,012 | 0,00014 |
1998 | 2,197 | 4,156 | 4,828 | 9,131 | 4,172 | -0,016 | 0,00026 |
1999 | 2,303 | 4,159 | 5,302 | 9,576 | 4,164 | -0,005 | ""0,00003 |
2000 | 2,398 | 4,164 | 5,750 | 9,984 | 4,156 | 0,007 | 0,00005 |
Итого | 17,502 | 46,422 | 33,400 | 73,424 | 46,422 | 0,000 | 0,00234 |
Средняя | 1,591 | 4,220 | — | — | |— |
| 0,00021 |
Сигма | 0,710 | 0,058 | — | — | — | — | — |
В | 0,505 | 0,0034 | — | — | — | — | — |
После процедуры потенцирования получаем уравнения в естественной форме:
| 177,5 * *^079 или иначе = 77,5 * И.
В модели нашло отражение единственная тенденция устойчивого сокращения численности занятых со снижающимся темпом этого сокращения. Если использовать модель для прогноза, то это будет прогноз «нижения численности занятых, но при этом, процент её (численности) сокращения год от года будет уменьшаться. степенная модель выявляет связь, которая оценивается как весьма тесная и статистически
значимая: В = = л/0,9382 = 0,968. Рфака, = 136>Ш = 5,12. МВп.Ш»
Особо отметим, что в данном случае, так же, как и при оценке тесноты связи показательной модели, расчёты общей и остаточной дисперсий проводятся по линеаризованным значениям признака-результата, то есть по \п<2факт и \п<2расч
Расчёт ошибки аппроксимации приводится в табл. 7. Её значение очень невелико и составляет 1,7%. При отсутствии автокорреляции в отклонениях от тренда степенная модель может использоваться для прогноза без формальных ограничений.
г....... - | ||||||||
Годы |
| щ | №)2 | ■ | ^1пС2, |
|
| (</1п&„,)2 |
1990 | 77,2 | -1,9 | 3,6 | 2,8 | -0,025 | — | — | _ |
1991 | 73,1 | 0,7 | 0,5 | 1Д | 0,010 | -0,025 | -0,00025 | 0,000610 0,000101 |
1992 | 70,8 | 1,3 | 1,7 | 2,0 | 0,019 | 0,010 | 0,00019 | |
1993 | 69,2 | 1,7 | 2,9 | 2,6 | 0,025 | 0,019 | 0,00047 | 0,000355 |
1994 | 67,9 | 0,6 | 0,4 | 0,8 | 0,008 | 0,025 | 0,00020 | 0,000617 |
1995 | 67,0 | -0,6 | 0,4 | 0,8 | -0,009 | 0,008 | -0,00007 | 0,000065 |
1996 | 66,2 | -0,2 | 0,0 | 0,2 | -0,002 | -0,009 | 0,00002 | 0,000074 |
1997 | 65,5 | -0,8 | 0,6 | 1,1 | -0,012 | -0,002 | 0,00003 | 0,000006 |
1998 | 64,9 | на | 1,2 | 1,6 | -0,016 | -0,012 | 0,00019 | 0,000139 |
1999 | 64,3 | -0,3 | 0,1 | 0,5 | -0,005 | -0,016 | 0,00008 | 0,000271 |
2000 | 63,8 | 0,5 | 0,3 | 0,7 | 0,007 | -0,005 | -0,00004 | 0,000025 |
Итого | 749,73 | 0,1 | 11,7 | 14,1 | 0,025 | -0,007 | 0,00083 | 0,002265 |
Средняя | — | — | 1,06 | 1,3 | 0,0025 | -0,0007 | — | _ |
О | — | — | — | — | 0,01283 | 0,01503 | — | _ |
В табл. 7 приводятся результаты проверки остатков на их автокоррелированность. В результате установлено, что в остатках существует умеренная связь, но она не является статистически значимой, то есть ряд отклонений представляют собой случайную переменную.
Д = 10*0,002265-0,0252 =0,022025; Щ = 10*0,00083-0,025*(-0,007) = 0,008475;
0,008475 Л„ш 0,01503 №§ 2 ло__
с ■-- 0,38; г,0 ап = 0,38 *-= 0,45 , г5пап = 0,203;
1 0,022025 ^'<5'а-, 0,01283 40**~1
0,203 1
Рфакт. = 0'797 ■* 101_1 = 2>03; Рфакт = 2,03 < Ртабл = 5,32 .
Следовательно, нулевая гипотеза о статистической незначимости взаимосвязи отклонений от степенного тренда должна быть принята, при том, что вероятность допустить ошибку не превысит общепринятого 5% уровня.
Следовательно, степенной тренд отражает влияние комплекса систематических факторов и после исключения этого влияния из фактических уровней в них остаются значения, случайные по своей природе. Поэтому нет формальных ограничений на использование степенной модели в прогнозных расчётах.
5.Выполним расчёт параметров уравнения параболы второго порядка и оценим возможность её использования для выполнения прогнозов.
Значения параметров рассчитаем, используя определители третьего порядка, формулы которых приведены в решении типовой задачи №1. Необходимые данные представлены в табл. 8. В результате получены следующие значения определителей системы нормальных уравнений:
Годы | Щ | 1 |
| I2 | ;3 | г4 | а*/2 | б расч. | Щ |
| I |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
1990 | 75,3 | 1 | 75,3 | 1 | 1 | 1 | 75,3 | 75,9 | -0,6 | 0,36 | 0,9 |
1991 | 73,8 | 2 | 147,6 | 4 | 8 | 16 | 295,2 | 73,7 | од | 0,01 | 0,1 |
1992 | 72,1 | 3 | 216,3 | 9 | 27 | 81 | 648,9 | 71,7 | 0,4 | 0,16 | 0,6 |
1993 | 70,9 | 4 | 283,6 | 16 | 64 | 256 | 1134,4 | 69,9 | 1,0 | 1,00 | 1,4 |
1994 | 68,5 | 5 | 342,5 | 25 | 125 | 625 | 1712,5 | 68,4 | 0,1 | 0,01 | 0,2 |
1995 | 66,4 | 6 | 398,4"" | 36 | 216" | 1296 | 2390,4 | 67,0 | -0,6 | 0,36 | 0,9 0,1 |
1996 | 66,0 | 7 | 462,0 | 49 | 343 | 2401 | 3234 | 65,9 | 0,1 | 0,01 | |
1997 | 64,7 | 8 | 517,6 | 64 | 512 | 4096 | 4140,8 | 65,1 | -0,4 | 0,16 | 0,5 |
1998 | 63,8 | 9 | 574,2 | 81 | 729 | 6561 | 5167,8 | 64,4 | -0,6 0,0 | 0,36 | 0,9 0,0 |
1999 | 64,0 | 10 | 640,0 | 100 | 1000 | 10000 | 6400 | 64,0 | 0,00 | ||
2000 | 64,3 | 11 | 707,3 | 121 | 1331 | 14641 | 7780,3 | 63,8 | 0,5 | 0,25 | 0,8 |
Итого | 749,8 | 66 | 4364,8 | 506 | 4356 | 39974 | 32979,6 | 749,8 | 0,0 | 2,68 | 6,5 |
Средняя | 68,2 | 6 |
|
|
|
|
|
| — | 0,24 | 0,6 |
Сигма | 4,01 | 3,16 | — | — | — | — | — | — | — | _ | _ |
V | 16,08 | 10,0 | — | — | — | — | — | — | — | — | — |
А = 1.038.180,0 ; Аа0 =81.399.604,0; А^ =-2.670.228,0; Аа2 =117.128
I 8^399.604,0 -2.670.228,0 И 117.128,0 ЦШ
а0 = ——-= 78,41 Щ--= -2,57; а1 =--— = 0,1128.
1.038.180,0 1.038.180,0 2 1.038.180,0
Уравнение параболы второго порядка имеет вид: 4 = 78,41 - 2,57 * / + ОД 128 * г2. Знак минус у коэффициента регрессии а2 указывает на то, что парабола обращена своей вершиной вниз. То есть, у параболы есть точка минимума, в которой результату принимает наименьшее значение. Достигаете* это минимальное значение при условии равенства нулю первой производной данной функции. В нашем примере ау1 = 0 или
ау1 =-2,57 + 2*0,1128*^ = 0. Отсюда ( = —Н— = 11,4.
2*0,1128
В соответствии с используемой моделью параболы второго порядка численность занятых в экономике РФ будет наименьшей в период между 11 и 12 годами, то есть в период 2000-2001 года. В этот момент численность занятых достигнет своего минимального значения в
63,8 млн. чел.:
4 =78,41 -2,57**+ 0,1128*I2 =78,41 - 2,57 * 11,4 + 0,1128* 11,42 =63,8 (млн. чел.). Начиная с этого момента, в соответствии с рассматриваемой моделью, численность занятых в экономике РФ будет постепенно увеличиваться. Проблема состоит в том, чтобы определить те временные границы, в которых рассматриваемая модель может использоваться с наибольшей результативностью, т.е. давать наиболее точные и достоверные прогнозы.
Для нас важной особенностью представляемой модели является то, что в ней реализуется гипотеза о стабилизации процесса снижения численности занятых и следующего за ним процесса постепенного увеличения контингента занятых. Но, при этом, очень важно, чтобы для модели были характерны высокие оценочные параметры. В гр. 9, 10 и 11 представлены данные для расчёта показателей тесноты описанной параболой связи. Уравнение выявило весьма тесную связь ( ра = ^1 - = ^/0,9851 = 0,993), которая на 98,5% детерминирована системой устойчивых, статистически значимых факто- его табличное значение: ЩШ К | п^2_{ = 231 >^«л. 14>46 при ^//=2; й?./2-8 при
«=0,05.
Ошибка аппроксимации имеет весьма малое значение: е' =0,6%, что указывает на хорошие перспективы при использовании модели для прогнозных расчётов.
В табл. 9 представлены данные для проверки наличия автокорреляции в отклонениях фактических уровней ряда от теоретических, рассчитанных по уравнению параболы. Рассчитаем определители для коэффициента регрессии отклонений С/ и по ним определим его значение: А = п * Е (</(?,_, )2 - * 2У6,~! =10 * 2>431 (-°>5) * (~°>5) 124,01;
Ас, | 1 * X (42, * _!) - 2>й * X 42,-, = Ю * 0,56 - 0,6 * (-0,5) - 5,9; С помощью коэффициента регрессии отклонений (с/) и значений средних квадратических отклонений каждого ряда остатков (о^ и сг^ Я определим коэффициент автокорреляции:
О 491 -у
Г«>А>,, = °'246* = °'254; = 0,064 •
= : -^г[гг=°-531 /г—■ = 5-32
Годы | Фрасч. |
|
| </1пе,*</1пем | (</1п(2м)2 |
1990 | 77,2 | -0,6 | — | — | — |
1991 | 73,1 | 0,1 | -0,6 | -0,06 | 0,36 |
1992 | 70,8 | 0,4 | 0,1 | 0,04 | 0,01 |
1993 | 69,2 | 1,0 | 0,4 | 0,40 | 0,16 |
1994 | 67,9 | 0,1 | 1,0 | 0,10 | 1,00 |
1995 | 67,0 | -0,6 | 0,1 | -0,06 | 0,01 |
1996 | 66,2 | 0,1 | -0,6 | -0,06 | 0,36 |
1997 | 65,5 | -0,4 | 0,1 | -0,04 | 0,01 |
1998 | 64,9 | -0,6 | -0,4 | 0,24 | 0,16 |
1999 | 64,3 | 0,0 | -0,6 | -0,00 | 0,36 |
2000 | 63,8 | 0,5 | 0,0 | 0,00 | 0,00 |
Итого | 749,73 | 0,6 | -0,5 | 0,56 | 2,43 |
Средняя | — | 0,06 | -0,05 | — | — |
| — | 0,476 | 0,491 | — | — |
Как показали расчёты коэффициента автокорреляции, отклонения от параболического тренда находятся в слабой взаимосвязи, которая не является статистически значимой, устойчивой и надёжной. То есть, парабола наилучшим образом отражает форму основной тенденции в фактических уровнях.
Кроме того, парабола способна реализовать прогноз, основанный на предположении о постепенной стабилизации численности занятых с её последующим увеличением. В
качестве альтернативы может быть рассмотрен прогноз, основанный на гипотезе о снижающейся численности занятых, но с затухающими темпами этого снижения, то есть вариант стабилизирующейся численности занятых. Указанный вариант прогноза может быть выполнен либо по уравнению равносторонней гиперболы, либо по степенной модели. Окончательный выбор вариантов прогноза может быть сделан по результатам анализа оперативной информации о текущих изменениях численности занятых в экономике РФ. заканчиваем решение задачи выполнением прогноза по параОоле второго порядка. .Прогноз выполним на четыре года: на 2001 - 2004 гг. Условный фактор - фактор времени /, Примет прогнозные значения, продолжающие натуральный ряд чисел, использованных для его обозначения. То есть, 1ШХ = 12; 72002 113; 71Ш = 14; 72Ш = 15.
При подстановке значений } и \г в уравнение параболы и после выполнения соответствующих расчётов получаем прогнозные значения численности занятых:
Сг=12(2001) = 63,8 МЛН- ЧеЛ«;
^13(2002) =64>° млн. чел.;
б?=14(2ооз) =64,5 млн. чел.;
бг=15(2оо4) 165,2 млн. чел. По результатам прогноза по параболе численность занятого населения в ближайшие годы будет постепенно возрастать, достигая 64 - 65 млн. чел.
Задача №7.
Данные о стоимости экспорта (Л/,) и импорта (2,) Франции, млрд. $, приводятся за период с 1991 по 2000 г.
В уровнях рядов выявлены линейные тренды: им и экспорта - й( = 206,4 +10,95 * /, а для импорта - %1 = 209,7 + 9,267 * (.
По указанным трендам произведено выравнивание каждого ряда, то есть рассчитаны теоретические значения их уровней: Мтеор.~ м, и 2теор 1 %(
Годы | Экспорт ( Л/,) | Импорт ( 2,) | ||
^ факт. ■ | МтеоР=^( | ^факт. | 2 Щ •теор. | |
1991 | 217 | 217 | 232 | 219 |
1992 | 236 | 228 | 240 | 228 |
1993 | 209 | 240 | 202 | 238 |
1994 | 236 | 250 | 230 | 247 |
1995 | 287 | 261 | 275 | 256 |
1996 | 289 | 272 | 278 | 265 |
1997 | 290 | 283 | 270 | 275 |
1998 | 306 | 294 | 289 | 284 |
1999 | 301 | 305 | 290 | 293 |
2000 | 295 | 316 | 301 | 302 |
Предварительная обработка исходной информации привела к следующим результатам:
| мх | я* | X |
Л | 1 | 0,9606 | 0,8836 |
| 0,9606 | 1 | 0,8629 |
Т | 0,8836 | 0,8629 | 1 |
Итого | 2666 | 2607 | 55 |
Средняя | 266,6 | 260,7 | 5,5 |
а | 35,579 | 30,845 | 2,872 |
Задание:
1. Для изучения связи рядов рассчитайте отклонения фактических значений каждого ряда от теоретических {Ш = Мфтт - Мтеор и </2 = ||Н - 2шор)\
2. Для оценки тесноты связи рассчитайте: 1) линейный коэффициент парной корреляции отклонений от линии тренда: ; 2) уровней рядов: гш и 3) коэффициент частной корреляции уровней: гш*(; поясните их значения, укажите причины различий значений парных коэффициентов корреляции (пп. 1 и 2) и схожести коэффициентов парной корреляции отклонений и частной корреляции уровней (пп. 1 и 3);
3. Постройте уравнение множественной регрессии с участием временной сМ( = а0 + а{ * 2( + аг * Ц
4. Проанализируйте полученные результаты. Решение.
1. Изучение связи рядов выполним двумя способами, сравним их результаты и выберем из них правильный. Для оценки тесноты связи рядов через величины отклонений от оптимального тренда рассчитаем значения отклонений'. а'М( = Мфакт ~ Мтеор и
42, I % факт. ~ % теор. (см. Табл. 1)
Таблица 1.
Годы | Мфакт. | йУтеор. | 7 факт. | 2 теор. |
| 42 | 4Л/*д2 | (4М)2 | (42)2 |
1991 | 217 | 217 | 232 | 219 | 0 | 13 | 0 | 0 | 169 |
1992 | 236 | 228 | 240 | 228 | 8 | 12 | 96 | 64 | 144 |
1993 | 209 | 240 | 202 | 238 | -31 | -36 | 1116 | 961 | 1296 |
1994 | 236 | 250 | 230 | 247 | -14 | -17 | 238 | 196 | 289 |
1995 | 287 | 261 | 275 | 256 | 26 | 19 | 494 | 676 | 361 |
1996 | 289 | 272 | 278 | 265 | 17 | 13 | 221 | 289 | 169 |
1997 | 290 | 283 | 270 | 275 | 7 | -5 | -35 | 49 | 25 |
1998 | 306 | 294 | 289 | 284 | 12 | 5 | 60 | 144 | 25 |
1999 | 301 | 305 | 290 | 293 | -4 | -3 | 12 | 16 | 9 |
2000 | 295 | 316 | 301 | 302 | -21 | -1 | 21 | 441 | 1 |
Итого | 2666 | — | 2607 | — | 0 | 0 | 2223 | 2836 | 2488 |
Средняя | 266,6 | — | 260,7 | — | 0 | 0 | — | 283,6 | 248,8 |
Сигма | 35,58 | — | 30,84 | — | 16,84 | 15,77 |
| _ |
|
| 1265,84 | — | 951,41 | — | 283,60 | 248,80 | — | — | — |
Выполним расчёт коэффициента корреляции отклонений от трендов через коэффициент регрессии отклонений сь ош и оаг. Но для этого предварительно рассчитаем определи-
тели второго порядка по уравнению регрессии отклонений: 4М = с0+сх*с12.
Л = п * ^ (42)2 - 242 * X 42 =10 * 2488 = 24880 Аа0 =Х4М*Х(4М)2 -Х(4М*42)*242 = 0 Л<ч =«*Х(4М*42)-5]4Л/*Х42 = 10*2223 = 22230
22230 с ШШ**Ж о,8935 1 24880
В силу того, что свободный член уравнения регрессии отклонений равен нулю, вид уравнения будет отличаться от традиционного: 4м = 0,8935*42. С изменением отлонений импорта от своего тренда на единицу отклонения экспорта от своего тренда изменятся в том же направлении на 0,8935 часть своей единицы. В дальнейшем коэффициент с/ используется для расчёта показателей тесноты связи двух рядов отклонений:
Гама-! 11 *— = °да35*^ = 0,8368; г^2 = 0,7001.
Выявлена тесная связь отклонений от трендов, которая означает, что на 70,0% вариация размеров отклонений по импорту детерминирует изменения по экспорту, а на 30% вариация размеров отклонений происходит под влиянием прочих факторов.
Второй вариант оценки связи двух рядов основан на традиционной оценке корреляции их уровней: ки ИНН
Данный подход к решению задачи предполагает традиционный расчет определителей уравнения регрессии уровнеж нахождение коэффициента регрессии Лу и далее с помощью См и о7 расчет коэффициента корреляции. Информация для расчёта представлена в табл. 2.
Расчёт определителей дал следующие результаты:
А = п*_(2)2 -_]2*_2 = 95141 Ла0 =ХЛ/*2(2)2 -_(М*2)*_2 = -2.117.882,0 Аах = п*_(М*2)-_М*_2 = №.Ш,0 Значения параметров регрессии: а0 = -22,26 ; ах = 1,108 , а уравнение имеет вид:
М~, =-22,26 + 1,108*2,.
Коэффициенты тесноты связи уровней составят:/*^ = 1,108*^^ = 0,9606; г^2 -0,9228.
35,58
Это значит, что в уровнях существует весьма тесная связь, при которой вариации импорта предопределяет 92,2% вариации экспорта. _______Таблица 2.
Годы | Мфакт, | ^факт. | Мфакт. | 72 факт. | \4 * 7 Ш факт. *- факт. |
1991 | 217 | 232 | 47089 | 53824 | 50344 |
ПГ992 | 236 | 240 | 55696 | 57600 | 56640 |
1993 | 209 | 202 | 43681 | 40804 | 42218 |
1994 | 236 | 230 | 55696 | 52900 | 54280 |
1995 | 287 | 275 | 82369 | 75625 | 78925 |
1996 | 289 | 278 | 83521 | 77284 | 80342 |
^1997 | 290 | 270 | 84100 | 72900 | 78300 |
^1998 | 306 | 289- | 93636 | 83521 | 88434 |
1999 | 301 | 290 | 90601 | 84100 | 87290 |
2000 | 295 | 301 | 87025 | 90601 | 88795 |
Итого | 2666 | 2607 | 723414 | 689159 | 705568 |
Средняя | 266,6 | 260,7 |
|
|
|
Сигма | 35,58 | 30,84 |
|
|
|
| 1265,84 | 951,41 |
|
|
|
) Однако, делать подобный вывод было бы глубоко ошибочно потому, что в уровнях и одного, и другого рядов выявлены устойчивые, статистически значимые линейные тренды. В подобных условиях выявленное взаимодействие уровней не является причинной зависимостью, а представляет собой ложную связь, вызванную наличием трендов схожей линейной формы. В силу того, что оба тренда сформированы под влиянием разного комплекса факторов, схожесть их формы могут создавать иллюзию связи рядов. По добные соображения позволяют отказаться от результатов изучения связи уровней, содержащих тренд. В подобной ситуации пристального внимания заслуживает связь случайных отклонений от трендов. Именно этот подход позволяет выявить и количественно оценить истинную связь рядов.
В действительности связь рядов существует, оценивается она как тесная; то есть, в ней экспорт на 70% детерминирован вариацией импорта. Фактический ^-критерий равен 18,9. Это больше табличного (Г жа&1-==5,32), что доказывает надёжность и значимость истинной связи рядов. . Для формализованного представления подобных зависимостей и использования моделей связи динамических рядов в прогнозных расчётах предлагается построить множественную регрессионную модель связи рядов, включая в неё в качестве обязательной составляющей фактор времени (. Речь идёт о построении модели следующего вида: М( =а0 +а} *2( +а2 */. В данной задаче в уровнях обоих рядов присутствует линейный тренд. Поэтому включение в модель фактора времени позволит через коэффициент а2 отразить наличие линейного тренда в уровнях обоих рядов. Если в уровнях рядов представлены тренды иной, более сложной формы, тогда уравнение множественной регрессии должно через фактор времени отразить эту более сложную форму трендов. Истинную силу и направление связи рядов отразит коэффициент регрессии а1 , а тесноту их связи оценит частный коэффициент корреляции: гш*(.
Используем для расчёта параметров множественной регрессии матрицу парных коэффициентов корреляции, представленную в исходных данных.
Для построения уравнения в стандартизованном масштабе: 1М - р7 * (г + Д */, рассчитаем значения /?-коэффициентов:
п = гМ2 - гм, * гг, = 0,9606 - 0,8836 * 0,8629 _ р ^ г 1-4 1-0,86292
й _гш-гш*гъ _ 0,8836-0,9606* 0,8629 \-гг \-гг
1 Г7л 1 Г2(
Получено следующее уравнение: \м = 0,7756 * 17 + 0,2142 * /,.
Его параметры позволяют сделать вывод о том, что влияния импорта на экспорт почти в четыре раза сильнее, чем влияние систематических факторов, формирующих линейный тренд: 0г = 0,7756 > Д =0,2142.
По значениям р -коэффициентов рассчитаем параметры множественной рефессии в естественной форме: а. = В7 * = 0 7756 * 35,579 - 0,895; а2 = р. * = 0,2142 * 35,579 = 2,65 ог 30,845 ст, 2,872
а0 = М - ах * 2 - а2 * 1 = 266,6 - 0,895 * 260,7 - 2,65 * 5,5 - 18,78. Уравнение имеет вид:Л^2,? = 18,78 + 0,895*2, +2,65*/. С увеличением импорта на 1 млрд. $ экспорт увеличивается на 0,895 млрд.$; под влиянием комплекса систематических факторов (которые условно обозначили через I ) экспорт увеличивается в среднем за год на 2,65 млрд. $.
Оценку тесноты связи рядов, очищенную от влияния комплекса систематических факторв, даёт частный коэффициент корреляции:
0.9606-08836*0,8629 ^ ^ ^
# -*&)*(!- 4) л/(1 - 0,88362) * (1 - 0,86292) Как видим, получены результаты, совпадающие с оценками тесноты связи по отклонениям от лучших трендов, которыми, в данном случае, являются линейные тренды. Использование динамической модели в прогнозе заключается в подстановке в её правую часть прогнозных значений фактора 7, и фактора I. То есть, М% - в 18,78 Г 0,895 * 2 + 2,65 * 7. Приложении
Приложение 1.
к, - | к) -степс» | и свободы факторной дисперсии (к| кг 2 к, 3 | 1!П) ] | |||||||||
1 имени | к, ■ "Г |
| ||||||||||
« вободы | Уровень значимости, а | |||||||||||
01 1. ИОЧНОИ ин перСИИ (к] П-1П-1) | 0,10 | 0,05 | 0,01 | 0,10 | 0,05 | 0,01 | 0,10 | 0,05 | 0,01 | 0,10 | 0,05 | 0,01 |
1 | 39,9 | 161,5 | 4052 | 49,5 | 199,5 | 5000 | 53,6 | 215,72 | 5403 | 55,8 | 224,57 | 5625 |
2 | 8,5 | 18,5 | 98,5 | 9,0 | 19,0 | 99.00 | 9,2 | 19,16 | 99,2 | 19,2 | 19,25 | 99,30 |
3 | 5,54 | 10,13 | 34,1 | 5,46 | 9,6 | 30,82 | 5,39 | 9,28 | 29,5 | 5,34 | 9,12 | 28,71 |
4 | 4,54 | 7,71 | 21,2 | 4,32 | 6,9 | 18,00 | 4,19 | 6 V; | 16,7 | 4,11 | 6,39 | 15,98 |
5 | 4,06 | 6,61 | 16,3 | 3,78 | 5,79 | 13,27 | 3,62 |
| 12,1 | 3,52 | 5,19 | 11,39 |
6 | 3,78 | 5,99 | 13,8 | 3,46 | 5,14 | 10,92 | 3,29 | 4,76 | 9,8 | 3,18 | 4,53 | 9,15 |
7 | 3,59 | 5,59 | 12,3 | 3,26 | 4,74 | 9,55 | 3,07 | 4,35 | "8,5 | 2,96 | 4,12 | 7,85 |
8 | 3,46 | 5,32 | 11,3 | 3,11 | 4,46 | 8,65 | 2,92 | ■1.07 | 7 6 | " 2,81 | 3,84 | 7,01 |
9 | 3,36 | 5,12 | 10,6 | 3,01 | 4,26 | 8,02 | 2,81 | 1,86 | 7,0 | 2,69 | 3,63 | 6,42 |
10 | 1 3,29 | 4,96 | 10,0 | 2,92 | 4,10 | 7,56 | 2,73 | 3,71 | 6,6 | 2 61 | 3,48 | 5,99 |
1 1 | 3,23 | 4,84 | 9,7 | 2,86 | 3,98 | 7,20 | 2,66 | 3,59 | 6 2 | 2,54 | 3,36 | 5,67 |
12 | 3,18 | 4,75 | 9,3 | 2,81 | 3,88 | 6,93 | 2,61 | 3,49 | 6,0 | 2,48 | 3,26 | 5,41 |
13 | 3,14 | 4,67 | 9,1 | 2,76 | 3,80 1 | 6,70 | 2,56 | 3,41 | 5,7 | 2,43 | 3,18 | "~ 5,20 " |
14 | 3,10 | 4,60 | 8,9 | 2,73 | 3,74 | 6,51 | 2,52 | 3,34 1 | \<> | 2,39 | 3,11 | 5,03 |
15 | 3,07 | 4,54 | 8,7 | 2,70 | 3,68 | 6,36 | 2,49 | 3,29 | 5 А | 2,36 | 3,06 | 4,89 |
16 | 3,05 | 4,49 | 8,5 | 2,67 | 3,63 | 6,23 | 2,46 | 3,24 |
| 2,33 | 3,01 | Л 11 |
17 | 3,03 | 4,45 | 8,4 | 2,64 | 3,59 | 6,11 | 2,44 | 3,20 | 5^2 | 2 \ 1 | 2,96 | 4,67 |
18 | 3,01 | 4,41 | 8,3 | 2,62 | 3,55 | 6,01 | 2,42 | 3,16 | 5,1 | 2,29 | 2,93 | 4,58 |
19 | 2,99 | 4,38 | 8,2 | 2,61 | 3,52 | 5,93 | 2,40 | 3,13 | 5,0 | 2,27 | 2,90 | 4,50 |
20 | 2,97 | 4,35 | 7,9 | 2,59 | 3,49 | 5,72 | 2,38 | 3,10 | ^9 | 2,25 | 2,87 | 4,31 |
21 |
| 4,32 | 8,0 |
| 3,47 | 5,78 |
| 3,07 | 4,9 |
| 2,84 | 4,37 |
22 | 2,95 | 4,30 | 7,9 | 2,56 | 3,44 | 5,72 | 2,35 | 3,05 | 4,8 | 2,22 | 2,82 | 4,31 |
23 |
| 4,28 | 7,9 |
| 3,42 | 5,66 |
| 3,03 | 4,8 |
| 2,80 | 4,26 4,22 |
24 | 2,93 | 4,26 | 7,8 | 2,54 | 3,40 | 5,61 | 2,33 | 3,01 | 4,7 | 2,19 | 2,78 | |
25 |
| 4,24 | 7,8 |
| 3,38 | 5,57 |
| 2,99 | 17 |
| 2,76 | 4,18 1 |
26 | 2,91 | 4,22 | 7,7 | 25.2 | 3,37 | 5,53 | 2,31 | 2,98 | 4,6 | 2,17 | 2,73 | 4,14 |
30 | 2,88 | 4,17 | 7,56 | 2,49 | 3,32 | 5,39 | 2,28 | 2,92 | 4,5 | 2,14 | 2,69 | 4,02 |
40 | 2,84 | 4,08 | 7,31 | 2,44 | 3,23 | 5,18 | 2,23 | 2,84 | 4,3 | 2,09 | 2,61 | 3,83 |
60 | 2,79 | 4,00 | 7,08 | 2,39 | 3,15 | 4,98 | 2,18 | 2,76 | 4,1 | 2,04 | " 2,53 | 3,65 |
80 | 2,77 | 8,96 | 6,96 | 2,37 | 3,11 | 4,88 | 2,16 | 2,72 | 4,0 | 2,02 | 2,48 | 3,56 |
100 | 2,76 | 3,94 | 6,90 | 2,36 | 3,09 | 4,82 | 2,14 | 2,70 | 3,98 | 2,00 | 2,46 | 3,51 |
оо | 2,71 | 3,84 | 6,63 | 2,30 | 3,00 | 4,61 | 2,08 | 2,60 | 3,78 | 1,94 | 2,37 | 3,32 " |