Автор работы: Пользователь скрыл имя, 25 Января 2012 в 17:02, курсовая работа
Целью данной работы является построение модели прогноза инвестиционной привлекательности Калужской области на основе данных государственной статистики, исследуя долю инвестиций в основной капитал (%); долю иностранных инвестиций (%) и износ.
Для достижения поставленной цели решены следующие задачи:
• собрать информацию о Калужской области;
• собрать информацию о долях инвестиций в основной капитал и иностранных инвестиций по регионам России за 1999-2009 гг.;
• исследовать данные на корреляцию;
• исследовать данные на ложную корреляцию;
• аппроксимация модели связи и расчет прогноза.
Информационная база моделирования представляет собой временные ряды с числом уровней ряда n=11. Показатели не являются стоимостными, поэтому в данном случае приводить их к сопоставимой оценке через исключение инфляционной составляющей нет необходимости.
Шаг 3. Измерение линейной связи между временными рядами
Для выявления линейной зависимости между временными рядами используем линейный коэффициент корреляции (см. формула 1).
В формуле 1 используются обозначения - n объем выборки; x и у - значения признаков; ху, x и y с чертой – средние значения произведения и самих признаков, σх и σу - средние квадратические отклонения признаков.
В пакете Excel для расчета данного показателя используется статистическая функция «КОРРЕЛ». На её основе вычисленный по данным таблицы 1 rx1y=0,761858314, ryx2=0,071519683, rx1x2=0,029912364.
Проверим значимость rX1Y, rYX2, rX1X2, для чего применим критерий Стьюдента (см. формулу 2).
В
нашем примере расчетные
t0,05(9)=2,15<tрасч=3,52 => коэффициент rX1Y значим, связь доказана
t0,05 (9)=2,15>tрасч=0,21 => коэффициент rYX2 незначим
t0,05(9)=2,15>tрасч=0,08 => коэффициент
rX1X2 незначим
Поэтому
в последующих шагах
Шаг 4. Устранение эффекта «ложной корреляции»
В случае с временными рядами может возникать эффект «ложной» корреляции, так как оба индикатора зависят от времени, для его устранения выявим тренды в исследуемых рядах динамики и рассчитаем коэффициент корреляции на основе отклонений от трендов, исключив тем самым влияние времени, так как тренд – это зависимость индикатора от времени. В пакете Excel построение тренда по ряду значений встроено в функции «Мастера диаграмм», построив график значений ряда динамики, выделяем его на графике мышкой, затем вызываем контекстное меню и выбираем поле «Добавить линию тренда», во вкладке «Параметры» указываем вывести ошибку тренда и уравнение тренда. По данным нашего примера тренды имеют вид (см. рис. 2).
Рис2 Тренды
исследуемых временных рядов.
Для оценки средних ошибок и относительных ошибок трендов, расчета отклонений от трендов необходимо оформить таблицы промежуточных результатов (см. таблицу 2 и 3).
№ | Доля инвестиций в основной капитал, % | Значения тренда | Ошибки тренда | Квадрат ошибок тренда | Ранги по ошибкам тренда |
Δx=х-xt | |||||
1 | 2 | 3 | 4 | 5 | 6 |
1 | 0,422559 | 0,4866 | 0,064041 | 0,00410126 | 2 |
2 | 0,4542435 | 0,4294 | -0,0248435 | 0,0006172 | 7 |
3 | 0,4224064 | 0,3908 | -0,0316064 | 0,00099897 | 8 |
4 | 0,4227741 | 0,3708 | -0,0519741 | 0,00270131 | 9 |
5 | 0,4277877 | 0,3694 | -0,0583877 | 0,00340912 | 10 |
6 | 0,3657574 | 0,3866 | 0,0208426 | 0,00043442 | 5 |
7 | 0,3772802 | 0,4224 | 0,0451198 | 0,00203579 | 3 |
8 | 0,3868269 | 0,4768 | 0,0899731 | 0,00809516 | 1 |
9 | 0,521305 | 0,5498 | 0,028495 | 0,00081197 | 4 |
10 | 0,7546447 | 0,6414 | -0,1132447 | 0,01282436 | 11 |
11 | 0,7421829 | 0,7516 | 0,0094171 | 8,8681E-05 | 6 |
∑ | 5,2977677 | 5,2756 | -0,0221677 | 0,03611823 | 66 |
St | 0,067192104 | ||||
Vt | 14,40% | ||||
Среднее | 0,466655699 |
Таблица
3
№ | Доля иностранных инвестиций, % | Значения тренда | Ошибки тренда | Квадрат ошибок тренда | Ранги по ошибкам тренда |
Δx=х-xt | |||||
1 | 2 | 3 | 4 | 5 | 6 |
1 | 1,07673502 | 1,2608 | 0,18406498 | 0,03387992 | 2 |
2 | 0,73674742 | 0,8531 | 0,11635258 | 0,01353792 | 5 |
3 | 0,7224399 | 0,5396 | -0,1828399 | 0,03343043 | 9 |
4 | 0,88473399 | 0,3203 | -0,56443399 | 0,31858573 | 11 |
5 | 0,0923301 | 0,1952 | 0,1028699 | 0,01058222 | 7 |
6 | 0,0593919 | 0,1643 | 0,1049081 | 0,01100571 | 6 |
7 | 0,04723487 | 0,2276 | 0,18036513 | 0,03253158 | 3 |
8 | 0,2307042 | 0,3851 | 0,1543958 | 0,02383806 | 4 |
9 | 0,31505305 | 0,6368 | 0,32174695 | 0,1035211 | 1 |
10 | 1,44882017 | 0,9827 | -0,46612017 | 0,21726801 | 10 |
11 | 1,38272038 | 1,4228 | 0,04007962 | 0,00160638 | 8 |
∑ | 6,99691099 | 6,9883 | -0,00861099 | 0,79978706 | 66 |
St | 0,316185677 | ||||
Vt | 84,90% | ||||
Среднее | 0,372435606 |
По данным
итоговой строки таблицы 2 столбца 5 определим
среднюю ошибку тренда для показателей
(см. формулу 3).
, где m – число коэффициентов в уравнении тренда.
Относительная
ошибка тренда (см. формулу 4) рассчитана
в двух предыдущих таблицах. Если относительная
ошибка тренда менее 12-15 % считается, что
тренд достаточно хорошо аппроксимирует
зависимость показателя от времени.
Для тренда по индикатору х1 Vt равна 14,40%.
Для тренда по y она равна 84,90%. В результате
мы получили, что оба индикатора имеют
незначимый тренд, то есть нет зависимости
от времени, поэтому эффект «ложной корреляции»
отсутствует в наших расчетах и дальнейшие
расчеты следует проводить на основе прямых
индикаторов – доли иностранных инвестиций
и инвестиций в основной капитал.
Шаг
5. Обоснование линейности связи
между индикаторами
Чтобы обосновать линейность связи, рассчитаем ранговый коэффициент корреляции Спирмена, который показывает и линейную и нелинейную связь между показателями (см. формулу 5).
где d –
разность рангов коррелируемых показателей
(см. таблицу 4 и столбцы 6 в таблицах 2 и
3). Для определения ранга в интервале данных
для конкретного значения используется
функция «Ранг» в Excel.
Таблица
4
№ | Разность рангов d2 (XY) |
1 | 0 |
2 | 4 |
3 | 1 |
4 | 4 |
5 | 9 |
6 | 1 |
7 | 0 |
8 | 9 |
9 | 9 |
10 | 1 |
11 | 4 |
∑ | 42 |
В нашем
примере ρ=1-(6*42)/(11*(121-1)
Шаг 6. Построение парной нелинейной модели регрессии между ошибками трендов
В результате сравнительного анализа коэффициентов детерминации по линейной и нелинейной форме модели парной зависимости выяснено, что наша модель нелинейная, поэтому будем действовать следующим образом. В пакете Excel расчет оценок параметров нелинейной модели регрессии осуществляется с помощью встроенной статистической функции массива «ЛГРФПРИБЛ». Данные функции вместо одного значения выдают массив переменных, который нужно предварительно выделить. Например, в случае нашего примера мы должны выделить интервал ячеек, в котором 5 строчек и 2 столбца (по числу коэффициентов регрессии). Затем нужно вызвать функцию и заполнить её поля: «Известные значения У» - интервал со значениями у; «Известные значения Х» - интервал со значениями х1; «Конст» - 1 (наличие свободного члена в модели, если его нет = 0); «Статистика» - 1 (для вычисления необходимых статистик). Ввод функции массива имеет особенности, так как необходимо нажать одновременно комбинацию клавиш «Ctrl+Shift+Enter». В формульной строке появятся скобки {}, а в выделенном интервале необходимые значения (см таблицу 5). В таблице 5 выделены значения, выдаваемые как результат функции «ЛГРФПРИБЛ».
Наименование показателя | Значение коэффициента регрессии а1 | Значение коэффициента регрессии а0 | Примечание |
Значения коэффициентов | 2,8793018 | -0,75063 | |
Стандартные ошибки коэффициентов регрессии Sa | 0,8160089 | 0,407477 | |
Коэффициент детерминации R2 | 0,5804281 | 0,357009 | Sy |
Расчетное значение F-статистики | 12,450435 | 9 | n-m |
Суммы квадратов | 1,5868762 | 1,147099 | |
RSS | ESS |