Влияние различных факторов на валовой сбор сельскохозяйственных культур (по данным статистики Республики Казахстан)
Отчет по практике, 25 Сентября 2011, автор: пользователь скрыл имя
Описание работы
Сельскохозяйственные культуры – это культурные растения, возделываемые с целью получения продуктов питания, технического сырья и корма для скота.
Валовой сбор сельскохозяйственных культур - есть объём фактически произведённой (собранной) продукции сельскохозяйственных культур, обычно учитывается по отдельным культурам, либо по некоторым группам культур со всей площади посева.
Содержание работы
Построение модели множественной регрессии
Анализ факторов на мультиколлинеарность
Отбор существенных факторов
Пошаговая регрессия
Первый шаг
Второй шаг
Прогнозное значение
Динамический ряд
Абсолютный прирост
Темп роста
Темп прироста
Методы выявления основной тенденции в рядах динамики
Метод укрупнения интервалов
Метод скользящей средней
Аналитическое выравнивание
Файлы: 1 файл
Казахский Экономический Университет им (Восстановлен).docx
— 83.76 Кб (Скачать файл)Казахский Экономический Университет им. Т. Рыскулова
Факультет Управления
Кафедра
Прикладной математики
ПРОЕКТ
Влияние
различных факторов
на валовой сбор сельскохозяйственных
культур (по данным статистики
Республики Казахстан)
(дисциплина:
«Эконометрика»)
Выполнили: Омарова Арзигуль
СКС-205
Научный
руководитель: Мадиярова К. З.
Алматы 2011
Задание
- Построение модели множественной регрессии
- Анализ факторов на мультиколлинеарность
- Отбор существенных факторов
- Пошаговая регрессия
- Первый шаг
- Второй шаг
- Прогнозное значение
- Динамический ряд
- Абсолютный прирост
- Темп роста
- Темп прироста
- Методы выявления основной тенденции в рядах динамики
- Метод укрупнения интервалов
- Метод скользящей средней
- Аналитическое выравнивание
Введение
Сельскохозяйственные
культуры – это культурные растения,
возделываемые с целью
Валовой сбор сельскохозяйственных культур - есть объём фактически произведённой (собранной) продукции сельскохозяйственных культур, обычно учитывается по отдельным культурам, либо по некоторым группам культур со всей площади посева.
В работе в качестве факторных признаков, влияющих на валовой сбор сельскохозяйственных культур Республики Казахстан, взяты: посевная площадь, число сельскохозяйственных предприятий, количество удобрений и число комбайнов.
Статистические данные отобраны за последние 16 лет (1995 – 2010гг.). Методами множественной (многофакторной) корреляции необходимо определить форму и тесноту связи между результативным фактором (валовым сбором) и факторными признаками.
Многофакторный
корреляционно-регрессионный
- обосновать взаимосвязи факторов, влияющих на исследуемый показатель;
- определить степень влияния каждого фактора на результативный признак путем построения модели-уравнения множественной регрессии, которая позволяет установить, в каком направлении и на какую величину изменится результативный признак при изменении каждого фактора, входящего в модель;
- количественно оценить тесноту связи между результативным признаком и факторами.
- Построение модели множественной регрессии
Целью исследования является анализ статистических данных за последние 16 лет и прогнозирование данных валового сбора сельскохозяйственных культур в РК на ближайшие годы.
Задача состоит в проведении многофакторного корреляционно-регрессионного анализа, на основе которого можно будет определить тесноту связи между факторами.
Включение
в уравнение множественной
Включение
в модель факторов с высокой
Отбор
факторов, включаемых в уравнение
множественной регрессии, является
одним из важнейших этапов построения
уравнения множественной
Отбор
факторов включает этапы, которые будут
описываться далее.
- Анализ факторов на мультиколлинеарность
На
этом этапе проводится анализ значений
коэффициентов парной корреляции между
всеми факторами (Таблица 1)
Таблица 1 – Корреляционная матрица
| Столбец 1 | Столбец 2 | Столбец 3 | Столбец 4 | Столбец 5 | |
| Валовый сбор | 1 | ||||
| Число комбайнов | 0,92018879 | 1 | |||
| Количество удобрений | 0,62485472 | 0,772899985 | 1 | ||
| Посевная площадь | 0,936833973 | 0,679628923 | 0,540136171 | 1 | |
| Число с/х предприятий | 0,744248945 | 0,833060425 | 0,546897268 | 0,569071147 | 1 |
Если
в матрице содержатся коэффициенты
корреляции, превышающие значения 0,75-0,8,
то это свидетельствует о
Первый
столбец показывает корреляцию, а
последующие
- Отбор существенных факторов
Отбор существенных факторов осуществляется с помощью коэффициентов β факторов, которые потенциально могут быть исключены.
Коэффициент β показывает, насколько изменяется функция с изменением аргумента на одну величину при фиксированном значении остальных аргументов. Коэффициент β вычисляется для каждых факторов по следующей формуле:
, или
- коэффициент β фактора хi;
bхi – коэффициент регрессии фактора хi;
δхi – среднеквадратическое отклонение фактора хi;
δу – среднеквадратическое отклонение функции.
Из всех факторов может быть исключен тот фактор, который имеет меньшее значение β. Если даже коэффициенты r первого фактора больше чем второй.
В
нашем случае значения β для каждых
факторов равны:
Таблица 2 – Отбор факторов
| Число комбайнов | βx1= | 0,56162125 |
| количество удобрений | βx2= | -0,1220024 |
| посевная площадь | βx3= | 0,54665217 |
| число с/х предприятий | βx4= | 0,03202331 |
Большее
значение β имеют факторы: количество
комбайнов и размер посевных площадей,
которые воздействуют на сбор сельскохозяйственных
культур больше, чем оставшиеся 2 фактора.
- Пошаговая регрессия
Отбор факторов можно осуществить с помощью пошаговой регрессии. Сущность этого метода заключается в последовательном включении факторов в уравнение регрессии и проверке значимости.
В данной работе изучаем зависимость валового сбора сельскохозяйственных культур (У) от факторов за 16 лет (Таблица 3 представлена в приложении работы).
Х1 – Число комбайнов, тыс. ед.;
Х2 – Количество удобрений, тыс. тонн;
Х3 – Посевная площадь, тыс. га;
Х4 – Число сельскохозяйственных предприятий, единиц.
На
первом этапе устраняется
Ранее мультиколлинеарность уже была определена. И только 2 фактора (число комбайнов и посевная площадь) более тесно связаны, чем другие факторы (Таблица 1).
Если
рассмотреть связь
Таблица
8 – Решение регрессионного уравнения
У(х1, х2, х3, х4)
| Регрессионная статистика | ||||||
| Множественный R | 0,98 | |||||
| R-квадрат | 0,97 | |||||
| Нормированный R-квадрат | 0,96 | |||||
| Стандартная ошибка | 107,6 | |||||
| Наблюдения | 16 | |||||
| Дисперсионный анализ |
||||||
| df | SS | MS | F | Значимость F | ||
| Регрессия | 4 | 5296932 | 1E+06 | 114 | ###### | |
| Остаток | 11 | 127366 | 11579 | |||
| Итого | 15 | 5424297 | ||||
| |
||||||
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | |
| Y-пересечение | -2801 | 292,55 | -9,57 | #### | -3444,9 | -2157 |
| Переменная X 1 | 35,14 | 9,4 | 3,73 | 0 | 14,45 | 55,84 |
| Переменная X 2 | -2,07 | 1,32 | -1,56 | 0,15 | -4,99 | 0,84 |
| Переменная X 3 | 24,63 | 3,51 | 7,002 | 0 | 16,89 | 32,37 |
| Переменная X 4 | 0,013 | 0,03 | 0,35 | 0,73 | -0,072 | 0,1 |