Построение модели прогноза инвестиционной привлекательности Калужской области на основе данных государственной статистики

Автор работы: Пользователь скрыл имя, 25 Января 2012 в 17:02, курсовая работа

Описание работы

Целью данной работы является построение модели прогноза инвестиционной привлекательности Калужской области на основе данных государственной статистики, исследуя долю инвестиций в основной капитал (%); долю иностранных инвестиций (%) и износ.
Для достижения поставленной цели решены следующие задачи:
• собрать информацию о Калужской области;
• собрать информацию о долях инвестиций в основной капитал и иностранных инвестиций по регионам России за 1999-2009 гг.;
• исследовать данные на корреляцию;
• исследовать данные на ложную корреляцию;
• аппроксимация модели связи и расчет прогноза.

Файлы: 1 файл

Курсовая Статистика3 курс.doc

— 1.01 Мб (Скачать файл)
 

     Информационная  база моделирования представляет собой  временные ряды с числом уровней  ряда n=11. Показатели не являются стоимостными, поэтому в данном случае приводить их к сопоставимой оценке через исключение инфляционной составляющей нет необходимости.

     Шаг 3. Измерение линейной связи между  временными рядами

     Для выявления линейной зависимости  между временными рядами используем линейный коэффициент корреляции (см. формула 1).

     

      В формуле 1 используются обозначения - n объем выборки; x и у - значения признаков; ху, x и y с чертой – средние значения произведения и самих признаков, σх и σу - средние квадратические отклонения признаков.

В пакете Excel для расчета данного показателя используется статистическая функция «КОРРЕЛ». На её основе вычисленный по данным таблицы 1 rx1y=0,761858314, ryx2=0,071519683, rx1x2=0,029912364.

      Проверим  значимость rX1Y, rYX2, rX1X2, для чего применим критерий Стьюдента (см. формулу 2).

 
 
 

     В нашем примере расчетные значения t-критерия составили: 3,528517406,  0,215109904,  0,089777265. Табличное значение критерия находится по статистической таблице или с помощью встроенной в пакет Excel статистической функции «СТЬЮДРАСПРОБР». Для уровня значимости (ошибки) 0,05 и 9 степеней свободы (n-2) критическое значение составило 2,262157158.

     t0,05(9)=2,15<tрасч=3,52 => коэффициент rX1Y значим, связь доказана

     t0,05 (9)=2,15>tрасч=0,21 => коэффициент rYX2 незначим

         t0,05(9)=2,15>tрасч=0,08 => коэффициент rX1X2 незначим 

      Поэтому в последующих шагах моделирования  будем принимать во внимание и исследовать долю инвестиций в основной капитал (%) и долю иностранных инвестиций (%). 

Шаг 4. Устранение эффекта «ложной корреляции»

      В случае с временными рядами может  возникать эффект «ложной» корреляции, так как оба индикатора зависят  от времени, для его устранения выявим тренды в исследуемых рядах динамики и рассчитаем коэффициент корреляции на основе отклонений от трендов, исключив тем самым влияние времени, так как тренд – это зависимость индикатора от времени. В пакете Excel построение тренда по ряду значений встроено в функции «Мастера диаграмм», построив график значений ряда динамики, выделяем его на графике мышкой, затем вызываем контекстное меню и выбираем поле «Добавить линию тренда», во вкладке «Параметры» указываем вывести ошибку тренда и уравнение тренда. По данным нашего примера тренды имеют вид (см. рис. 2).

Рис2 Тренды исследуемых временных рядов. 

Для оценки средних ошибок и относительных  ошибок трендов, расчета отклонений от трендов необходимо оформить таблицы промежуточных результатов (см. таблицу 2 и 3).

                                                                                                                Таблица 2 

Доля  инвестиций в основной капитал, % Значения  тренда  Ошибки тренда Квадрат ошибок тренда Ранги по ошибкам тренда
Δx=х-xt
1 2 3 4 5 6
1 0,422559 0,4866 0,064041 0,00410126 2
2 0,4542435 0,4294 -0,0248435 0,0006172 7
3 0,4224064 0,3908 -0,0316064 0,00099897 8
4 0,4227741 0,3708 -0,0519741 0,00270131 9
5 0,4277877 0,3694 -0,0583877 0,00340912 10
6 0,3657574 0,3866 0,0208426 0,00043442 5
7 0,3772802 0,4224 0,0451198 0,00203579 3
8 0,3868269 0,4768 0,0899731 0,00809516 1
9 0,521305 0,5498 0,028495 0,00081197 4
10 0,7546447 0,6414 -0,1132447 0,01282436 11
11 0,7421829 0,7516 0,0094171 8,8681E-05 6
5,2977677 5,2756 -0,0221677 0,03611823 66
St 0,067192104        
Vt 14,40%        
Среднее 0,466655699        
 

Таблица 3 

Доля  иностранных инвестиций, % Значения  тренда  Ошибки тренда Квадрат ошибок тренда Ранги по ошибкам тренда
Δx=х-xt
1 2 3 4 5 6
1 1,07673502 1,2608 0,18406498 0,03387992 2
2 0,73674742 0,8531 0,11635258 0,01353792 5
3 0,7224399 0,5396 -0,1828399 0,03343043 9
4 0,88473399 0,3203 -0,56443399 0,31858573 11
5 0,0923301 0,1952 0,1028699 0,01058222 7
6 0,0593919 0,1643 0,1049081 0,01100571 6
7 0,04723487 0,2276 0,18036513 0,03253158 3
8 0,2307042 0,3851 0,1543958 0,02383806 4
9 0,31505305 0,6368 0,32174695 0,1035211 1
10 1,44882017 0,9827 -0,46612017 0,21726801 10
11 1,38272038 1,4228 0,04007962 0,00160638 8
6,99691099 6,9883 -0,00861099 0,79978706 66
St 0,316185677        
Vt 84,90%        
Среднее 0,372435606        

       По данным итоговой строки таблицы 2 столбца 5 определим  среднюю ошибку тренда для показателей (см. формулу 3). 

, где  m – число коэффициентов в уравнении тренда.

Относительная ошибка тренда (см. формулу 4) рассчитана в двух предыдущих таблицах. Если относительная  ошибка тренда менее 12-15 % считается, что  тренд достаточно хорошо аппроксимирует зависимость показателя от времени. Для тренда по индикатору х1 Vt равна 14,40%. Для тренда по y она равна 84,90%. В результате мы получили, что оба индикатора имеют незначимый тренд, то есть нет зависимости от времени, поэтому эффект «ложной корреляции» отсутствует в наших расчетах и дальнейшие расчеты следует проводить на основе прямых индикаторов – доли иностранных инвестиций и инвестиций в основной капитал. 

      Шаг 5. Обоснование линейности связи  между индикаторами 

      Чтобы обосновать линейность связи, рассчитаем ранговый коэффициент корреляции Спирмена, который показывает и линейную и нелинейную связь между показателями (см. формулу 5).

 
 

где d – разность рангов коррелируемых показателей (см. таблицу 4 и столбцы 6 в таблицах 2 и 3). Для определения ранга в интервале данных для конкретного значения используется функция «Ранг» в Excel. 

Таблица 4 
 

      Разность рангов d2 (XY)
      1 0
      2 4
      3 1
      4 4
      5 9
      6 1
      7 0
      8 9
      9 9
      10 1
      11 4
      42
 
 

В нашем  примере ρ=1-(6*42)/(11*(121-1))=0,80. Значимость коэффициента Спирмена проверяется также как rxy. tрас =0,458915331<2,57, то есть незначимый коэффициент.  

Шаг 6. Построение парной нелинейной модели регрессии между ошибками трендов

В результате сравнительного анализа коэффициентов  детерминации по линейной и нелинейной форме модели парной зависимости  выяснено, что наша модель нелинейная, поэтому будем действовать следующим образом. В пакете Excel расчет оценок параметров нелинейной модели регрессии осуществляется с помощью встроенной статистической функции массива «ЛГРФПРИБЛ». Данные функции вместо одного значения выдают массив переменных, который нужно предварительно выделить. Например, в случае нашего примера мы должны выделить интервал ячеек, в котором 5 строчек и 2 столбца (по числу коэффициентов регрессии). Затем нужно вызвать функцию и заполнить её поля: «Известные значения У» - интервал со значениями у; «Известные значения Х» - интервал со значениями х1; «Конст» - 1 (наличие свободного члена в модели, если его нет = 0); «Статистика» - 1 (для вычисления необходимых статистик). Ввод функции массива имеет особенности, так как необходимо нажать одновременно комбинацию клавиш «Ctrl+Shift+Enter». В формульной строке появятся скобки {}, а в выделенном интервале необходимые значения (см таблицу 5). В таблице 5 выделены значения, выдаваемые как результат функции «ЛГРФПРИБЛ».

                                                                                                                    Таблица 5

    Наименование  показателя Значение коэффициента регрессии а1 Значение коэффициента регрессии а0 Примечание
    Значения  коэффициентов 2,8793018 -0,75063  
    Стандартные ошибки коэффициентов регрессии Sa 0,8160089 0,407477  
    Коэффициент детерминации R2 0,5804281 0,357009 Sy
    Расчетное значение F-статистики 12,450435 9 n-m
    Суммы квадратов 1,5868762 1,147099  
      RSS ESS  

Информация о работе Построение модели прогноза инвестиционной привлекательности Калужской области на основе данных государственной статистики