Влияние различных факторов на валовой сбор сельскохозяйственных культур (по данным статистики Республики Казахстан)

Автор работы: Пользователь скрыл имя, 25 Сентября 2011 в 09:16, отчет по практике

Описание работы

Сельскохозяйственные культуры – это культурные растения, возделываемые с целью получения продуктов питания, технического сырья и корма для скота.
Валовой сбор сельскохозяйственных культур - есть объём фактически произведённой (собранной) продукции сельскохозяйственных культур, обычно учитывается по отдельным культурам, либо по некоторым группам культур со всей площади посева.

Содержание работы

Построение модели множественной регрессии
Анализ факторов на мультиколлинеарность
Отбор существенных факторов
Пошаговая регрессия
Первый шаг
Второй шаг
Прогнозное значение
Динамический ряд
Абсолютный прирост
Темп роста
Темп прироста
Методы выявления основной тенденции в рядах динамики
Метод укрупнения интервалов
Метод скользящей средней
Аналитическое выравнивание

Файлы: 1 файл

Казахский Экономический Университет им (Восстановлен).docx

— 83.76 Кб (Скачать файл)

Казахский Экономический Университет им. Т. Рыскулова

Факультет Управления

Кафедра Прикладной математики 
 
 
 
 
 
 

ПРОЕКТ

Влияние различных факторов на валовой сбор сельскохозяйственных культур (по данным статистики Республики Казахстан) 

(дисциплина: «Эконометрика») 
 
 
 
 
 

Выполнили: Омарова Арзигуль

СКС-205

Научный руководитель: Мадиярова К. З. 

Алматы 2011

Задание 

  1. Построение  модели множественной  регрессии
      1. Анализ факторов на мультиколлинеарность
      1. Отбор существенных факторов
  1. Пошаговая регрессия
      1. Первый шаг
      1. Второй шаг
      2. Прогнозное значение
  1. Динамический ряд
      1. Абсолютный прирост
      1. Темп роста
      2. Темп прироста
  1. Методы выявления основной тенденции в рядах динамики
      1. Метод укрупнения интервалов
      1. Метод скользящей средней
      2. Аналитическое выравнивание
 
 
 
 
 
 
 
 
 
 
 
 

     Введение 

     Сельскохозяйственные  культуры – это культурные растения, возделываемые с целью получения  продуктов питания, технического сырья  и корма для скота.

     Валовой сбор сельскохозяйственных культур - есть объём фактически произведённой (собранной) продукции сельскохозяйственных культур, обычно учитывается по отдельным культурам, либо по некоторым группам культур со всей площади посева.

     В работе в качестве факторных признаков, влияющих на валовой сбор сельскохозяйственных культур Республики Казахстан, взяты: посевная площадь, число сельскохозяйственных предприятий, количество удобрений и число комбайнов.

     Статистические данные отобраны за последние 16 лет (1995 – 2010гг.). Методами множественной (многофакторной) корреляции необходимо определить форму и тесноту связи между результативным фактором (валовым сбором) и факторными признаками.

     Многофакторный  корреляционно-регрессионный анализ сводится к решению следующих  задач:

  • обосновать взаимосвязи факторов, влияющих на исследуемый показатель;
  • определить степень влияния каждого фактора на результативный признак путем построения модели-уравнения множественной регрессии, которая позволяет установить, в каком направлении и на какую величину изменится результативный признак при изменении каждого фактора, входящего в модель;
  • количественно оценить тесноту связи между результативным признаком и факторами.
 
 
  1. Построение  модели множественной  регрессии
 

    Целью исследования является анализ статистических данных за последние 16 лет и прогнозирование данных валового сбора сельскохозяйственных культур в РК на ближайшие годы.

    Задача  состоит в проведении многофакторного корреляционно-регрессионного анализа, на основе которого можно будет определить тесноту связи между факторами.

    Включение в уравнение множественной регрессии  того или иного набора факторов обусловлено  тем, что факторы не должны быть мультиколлинеарными. Чем она сильнее, тем ненадежнее результаты множественной регрессии. Она определяется коэффициентом парной корреляции r>0,7.

    Включение в модель факторов с высокой мультиколлинеарностью  может привести к тому что система  нормальных уравнений может оказаться  плохо обусловленной и повлечь  за собой ненадежность оценок коэффициентов  регрессии. Также, если между факторами  существует высокая корреляция, то нельзя определить их влияние на результативный показатель и параметры уравнения  регрессии оказываются неинтерпретируемыми.

    Отбор факторов, включаемых в уравнение  множественной регрессии, является одним из важнейших этапов построения уравнения множественной регрессии.

    Отбор факторов включает этапы, которые будут  описываться далее. 
 
 
 
 
 
 

    1. Анализ  факторов на мультиколлинеарность
 

    На  этом этапе проводится анализ значений коэффициентов парной корреляции между  всеми факторами (Таблица 1) 

    Таблица 1 – Корреляционная матрица

  Столбец 1 Столбец 2 Столбец 3 Столбец 4 Столбец 5
Валовый сбор 1        
Число комбайнов 0,92018879 1      
Количество     удобрений 0,62485472 0,772899985 1    
Посевная  площадь 0,936833973 0,679628923 0,540136171 1  
Число с/х предприятий 0,744248945 0,833060425 0,546897268 0,569071147 1
 

    Если  в матрице содержатся коэффициенты корреляции, превышающие значения 0,75-0,8, то это свидетельствует о присутствии  мультиколлинеарности.

    Первый  столбец показывает корреляцию, а  последующие мультиколлинераность. Из данных факторов мы исключаем 2-й  и 4-й факторы (количество удобрений  и число с/х предприятий), так  как они мультиколлинеарны. 

    1. Отбор существенных факторов
 

    Отбор существенных факторов осуществляется с помощью коэффициентов β  факторов, которые потенциально могут  быть исключены.

    Коэффициент β показывает, насколько изменяется функция с изменением аргумента  на одну величину при фиксированном  значении остальных аргументов. Коэффициент  β вычисляется для каждых факторов по следующей формуле:

    

          , или 

     - коэффициент β фактора хi;

    bхi – коэффициент регрессии фактора хi;

    δхi – среднеквадратическое отклонение фактора хi;

    δу – среднеквадратическое отклонение функции.

    Из  всех факторов может быть исключен тот фактор, который имеет меньшее  значение β. Если даже коэффициенты r первого фактора больше чем второй.

    В нашем случае значения β для каждых факторов равны: 

    Таблица 2 – Отбор факторов

Число комбайнов βx1= 0,56162125
количество  удобрений βx2= -0,1220024
посевная  площадь βx3= 0,54665217
число с/х предприятий βx4= 0,03202331
 

    Большее значение β имеют факторы: количество комбайнов и размер посевных площадей, которые воздействуют на сбор сельскохозяйственных культур больше, чем оставшиеся 2 фактора. 

    1. Пошаговая регрессия
 

    Отбор факторов можно осуществить с  помощью пошаговой регрессии. Сущность этого метода заключается в последовательном включении факторов в уравнение  регрессии и проверке значимости.

    В данной работе изучаем зависимость  валового сбора сельскохозяйственных культур (У) от факторов за 16 лет (Таблица 3 представлена в приложении работы).

    Х1 – Число комбайнов, тыс. ед.;

    Х2 – Количество удобрений, тыс. тонн;

    Х3 – Посевная площадь, тыс. га;

    Х4 – Число сельскохозяйственных предприятий, единиц.

    На  первом этапе устраняется мультиколлинеарность факторов. Рассчитываются парные коэффициенты корреляции, представленные в виде корреляционной матрицы.

    Ранее мультиколлинеарность уже была определена. И только 2 фактора (число комбайнов  и посевная площадь) более тесно  связаны, чем другие факторы (Таблица 1).

    Если  рассмотреть связь результативного  признака со всеми факторами, то R2=0,97. Но t-статистика показывает, что только параметры Х1 и Х3 являются статистически значимыми. Поэтому в модель множественной регрессии достаточно включить только эти факторы. 

    Таблица 8 – Решение регрессионного уравнения  У(х1, х2, х3, х4) 

Регрессионная статистика          
Множественный R 0,98          
R-квадрат 0,97          
Нормированный R-квадрат 0,96          
Стандартная ошибка 107,6          
Наблюдения 16          
             
 
 
Дисперсионный анализ
         
  df SS MS F Значимость F  
Регрессия 4 5296932 1E+06 114 ######  
Остаток 11 127366 11579      
Итого 15 5424297        
 
 
 
           
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение -2801 292,55 -9,57 #### -3444,9 -2157
Переменная X 1 35,14 9,4 3,73 0 14,45 55,84
Переменная X 2 -2,07 1,32 -1,56 0,15 -4,99 0,84
Переменная X 3 24,63 3,51 7,002 0 16,89 32,37
Переменная X 4 0,013 0,03 0,35 0,73 -0,072 0,1

Информация о работе Влияние различных факторов на валовой сбор сельскохозяйственных культур (по данным статистики Республики Казахстан)