Корреляционно - регрессионный анализ нефтедобывающей промышленности

Автор работы: Пользователь скрыл имя, 06 Сентября 2011 в 11:05, курсовая работа

Описание работы

Исходя из актуальности, можно поставить следующую цель данной курсовой работы: выявление на основе статистического анализа факторов, определяющих развитие нефтедобывающей промышленности, а также возможное прогнозирование динамики рассматриваемых процессов.

Реализация основной цели исследования предполагает решение следующих задач:

- изучение, посредством методов статистики, характера динамики добычи нефти в России;

- выявления основных факторов, влияющих на добычу;

- выявление основных черт и тенденций формирования нефтедобывающих комплексов;

- проведение статистического анализа окружных особенностей нефтедобычи;

- перспективная оценка тенденций развития нефтедобывающей отрасли страны;

Содержание работы

Введение ……………………………………………………………………………………...3




Глава 1. ФАКТОРЫ И ОСОБЕННОСТИ РАЗВИТИЯ И РАЗМЕЩЕНИЯ НЕФТЕДОБЫВАЮЩЕЙ ПРОМЫШЛЕННОСТИ


1.1. Место нефтедобывающей промышленности в национальной экономике…………..5

1.2. Факторы, определяющие развитие нефтедобывающего комплекса ………………..6


Глава 2. СТАТИСТИЧЕСКАЯ ОЦЕНКА НЕФТЕДОБЫВАЮЩЕЙ

ОТРАСЛИ И ЕЕ ФАКТОРОВ:


2.1. Основные статистические методы……………………………………………………. 11

2.2. Построение эконометрических моделей и выводы по ним. ………………………... 17



Заключение …………………………………………………………………………………26



Список литературы ………………………………………………………………………..27

Файлы: 1 файл

готовая курсовая.docx

— 107.66 Кб (Скачать файл)

    В частности надо определить, какие  могут существовать виды связи между  зависимой переменной и независимой  переменной. В зависимости от направления действия все виды связей могут быть прямые и обратные.

    При прямой связи направление изменения  результативного признака совпадает  с направлением изменения признака-фактора, то есть с увеличением факторного признака увеличивается и результативный, и, наоборот, с уменьшением факторного признака уменьшается и результативный признак. В противном случае между  рассматриваемыми величинами существуют обратные связи.

      По аналитическому выражению  (форме) связи могут быть прямолинейными  и криволинейными. При прямолинейной  связи с возрастанием значения  факторного признака происходит  непрерывное возрастание (или  убывание) значений результативного  признака. Математически такая связь  представляется уравнением прямой, а графически – прямой линией. Отсюда ее более короткое название  – линейная связь. При криволинейных  связях с возрастанием значения  факторного признака возрастание  (или убывание) результативного признака  происходит неравномерно, или же  направление его изменения меняется  на обратное. Геометрически такие связи представляются кривыми линиями (гиперболой, параболой и т.д.).

    И что было отмечено ранее, по количеству факторов, действующих на результативный признак, связи различаются: однофакторные (один фактор) и многофакторные (два и более факторов). Однофакторные (простые) связи обычно называются парными (т.к. рассматривается пара признаков). В случае многофакторной (множественной) связи имеют в виду, что все факторы действуют комплексно, то есть одновременно и во взаимосвязи.

    В ходе данного исследования из –  за достаточно большого количества определенных влияющих на рождаемость факторов следует  рассматривать множественную связь. Кроме того, исходя из предположения о том, что все факторы прямолинейно воздействуют на уровень нефтедобычи, то в рамках данной курсовой работы будут рассматриваться именно линейные эконометрические модели. 

    Теперь  можно непосредственно приступить к описанию основных положений линейного  регрессионного анализа многофакторных моделей.

    Основными целями регрессионного анализа являются:

  • Определение степени детерминированности вариации критериальной (зависимой) переменной предикатами (независимыми переменными);
  • Предсказание значения зависимой переменной с помощью независимых;
  • Определение вклада отдельных независимых переменных в вариацию зависимой.

    На  основе достижения данных целей в  ходе работы мы сможем наиболее полно  описать существующие взаимосвязи  между рождаемостью и влияющими  на нее факторами. 

Множественный регрессионный анализ:

    В общем случае в регрессионный  анализ вовлекаются  не одна, а несколько независимых переменных. Это наносит ущерб наглядности получаемых результатов, так как подобные множественные связи, в конечном счете, становится невозможно представить графически. 

    В случае множественного регрессионного анализа речь идёт о необходимости оценки коэффициентов уравнения:  

где n — количество независимых переменных, обозначенных как хи хn,

       а — некоторая константа. 

    Как уже было сказано ранее, независимые  переменные не должны коррелировать  между собой.    

Линейный  множественный регрессионный  анализ:

    В ситуации, когда функция отзыва (цели) зависит не от одного, а от многих факторов, установление формы связи в таких случаях начинают, как правило с рассмотрения линейной регрессии такого вида: 

      
В таком случае результаты наблюдений должны быть представлены уравнениями, полученными в каждом из п опытов: 

 (1) 
или в виде матрицы результатов наблюдений: 

 
где – количество опытов; 

      k - количество факторов. 

Для решения системы уравнений представленной выше необходимо, чтобы количество опытов было не меньше  + 1, т.е. п    + 1. 

    Заданием множественного регрессионного анализа является построение такого уравнения прямой k-мерном пространстве, отклонение результатов наблюдений   от которой были бы минимальными. Используя для этого метод наименьших квадратов, получаем систему нормальных уравнений: 

 
которую представим в матричной форме 

(ХТХ)В XTY,     (2)

где  В - вектор-столбец коэффициентов уравнения регрессии; 

        X - матрица значений факторов; 

        Y - вектор-столбец функции отзыва; 

        XТ - транспонированная матрица X

      При , они соответственно равны: 

      

    Перемножив правую и левую часть уравнения (2) на обратную матрицу (ХТХ)-1, получим при:  
 
 

    Каждый коэффициент уравнения регрессии вычисляется по формуле:  

где  - элементы обратной матрицы (ХТХ)-1 

    Таким образом, найдя оценки параметров уравнения регрессионной модели, мы сможем выявить и охарактеризовать существующую связь между зависимой переменной и независимыми переменными. Но также не стоит забывать о наличии в эконометрической регрессионной модели постоянной константе, которая показывает и характеризует наличие вектора остатков неучтенных в модели признаков, которые в свое совокупности также оказывают влияние на критериальную переменную.

    Также следует учесть еще и то, что для практического использования моделей регрессии большое значение имеет их адекватность, то есть соответствие фактическим статистическим данным.

    Обычно регрессионный анализ проводится, и это уместно отметить и в структуре данной исследовательской работы, для ограниченной по объёму совокупности, поэтому различные показатели, характеризующие полученную взаимосвязь, могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.

    Проверка значимости уравнения регрессии проводится по F-критерию. Для этого вычисляется остаточная дисперсия: 

       
и  –
статистика 

    Данная расчетная статистика сравнивается с табличным значением   при уровне значимости α и числе ступеней свободы  kп - 1, kп – k - 1. 

    Гипотеза про значимость уравнения регрессии принимается при условии:  
. 

    При численности объектов анализа до 30 единиц возникает также необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин.

Значимость коэффициентов регрессии проверяется по t-критерию.  
Статистика  

сравнивается с табличным значением  при уровне значимости α и числе степеней свободы  kп – - 1.  
 
 

2.2.Построение эконометрических моделей и выводы по ним. 
 
 

    Исходя  из теоретических данных, несомненно, в данной исследовательской работе будет использоваться многофакторный анализ и множественная корреляция.

    Чтобы выявить какие признаки оказывают  наибольшее влияние на объемы нефтедобычи в нашей стране, в качестве результирующего показателя в данном исследовании был взят объем добычи нефти в Российской Федерации. Оценивать влияние на объем добычи я буду с помощью определяющих признаков, а именно с помощью:  числа действующих организаций в отрасли (Х1), среднегодовой численности промышленно-производственного персонала (Х2), объема эксплуатационного бурения на нефть (Х3), среднесуточного дебита одной скважины (Х4), степени износа основных фондов отрасли (Х5), количества введенных в действие производственных мощностей (нефтяных скважин, Х6), коэффициента обновления основных фондов (Х7), уровня рентабельности предприятий отрасли (Х8).

    Все данные были взяты за 10 лет с 2000 по 2009 года. В итоге можно увидеть  следующую таблицу:   

    Таблица 1. Исходные данные 

Год Добыча нефти, млн.т Число организа-ций Численность

персонала,

тыс. человек

Объем

бурения,

млн. м

Дебет

одной

скважины,

т

Степень износа основных фондов, % Ввод в действие нефтяных скважин, ед. Коэффициент обновления основных фондов Уровень рентабельности, %
  У Х1 Х2 Х3 Х4 Х5 Х6 Х7 Х8
2000 306,83 214 213 10,20   7,50 46,90 4 198 3,40 21,20
2001 301,23 273 246 6,90   7,40 48,3 2 921 3,00 14,90
2002 305,64 275 264 7,40 7,30 49,8 2 390 1,60 14,70
2003 303,28 385 289 5,00 7,70 52,1 2 274 1,70 17,60
2004 305,17 431 261 5,30 7,70 51,2 2 081 1,70 57,90
2005 323,52 439 267 9,30 7,50 53,3 2 833 2,90 66,70
2006 348,13 421 347 8,80 7,70 51,0 3 813 4,20 46,50
2007 379,56 436 331 8,60 8,30 53,9 3 145 3,70 20,60
2008 421,34 465 321 9,10 9,40 53,7 3 004 4,10 20,70
2009 459,21 637 293 8,30  10,10 53,10 3 123 3,70 36,30
 
 

    Все необходимые расчеты оценок эконометрических моделей, а также оценки их значимости, производились с использованием демонстрационной версии программы для обработки статистических данных  - IBM SPSS Statistics 19. Она позволяет в своем пакете статистических программ вычислить все необходимые показатели.

    Производить анализ я буду поэтапно, чтобы полностью  рассмотреть процесс построения эконометрических моделей.

    Первый  этап - корреляционный анализ. Его цель - определить характер связи (прямая, обратная) и силу связи (связь отсутствует, связь слабая, умеренная, заметная, сильная, весьма сильная, полная связь). Корреляционный анализ создает информацию о характере и степени выраженности связи (коэффициент корреляции), которая используется для отбора существенных факторов, а также для планирования эффективной последовательности расчета параметров регрессионных уравнений. При одном факторе вычисляют коэффициент корреляции, а при наличии нескольких факторов строят корреляционную матрицу, из которой выясняют два вида связей: (1) связи зависимой переменной с независимыми, (2) связи между самими независимыми.

    Рассмотрение  матрицы позволяет, во первых, выявить факторы, действительно влияющие на исследуемую зависимую переменную, и выстроить (ранжировать) их по убыванию связи; во-вторых, минимизировать число факторов в модели, исключив часть факторов, которые сильно или функционально связаны с другими факторами (речь идет о связях независимых переменных между собой).

Таблица 2. Матрица коэффициентов парной корреляции

  У Х1 Х2 Х3 Х4 Х5 Х6 Х7 Х8
У 1                
Х1 0,805* 1              
Х2 0,567 0,593 1            
Х3 0,382 - 0,002 0,068 1          
Х4 0,964* 0,805* 0,434 0,220 1        
Х5 0,630 0,819* 0,720* - 0,013 0,584 1      
Х6 0,221 - 0,153 0,039 0,813* 0,094 - 0,324 1    
Х7 0,663* 0,332 0,481 0,757* 0,521 0,212 0,779* 1  
Х8 - 0,006 0,429 0,071 0,058 - 0,046 0,310 -0,085 0,009 1

Информация о работе Корреляционно - регрессионный анализ нефтедобывающей промышленности