Исследование регрессионного анализа в статистическом изучении взаимосвязи показателей

Автор работы: Пользователь скрыл имя, 14 Марта 2011 в 21:56, курсовая работа

Описание работы

Целью курсовой работы является исследование регрессионного анализа в статистическом изучении взаимосвязи показателей.

Задачи курсовой работы:

- статистическое изучение взаимосвязи социально - экономических явлений и процессов;

- рассмотрение регрессионного анализа;

- исследование регрессионного анализа для изучения объекта исследования.

Файлы: 1 файл

ВВЕДЕНИЕрегрессия.docx

— 344.34 Кб (Скачать файл)

       Для корректного использования регрессионного анализа требуется выполнение определенных условий. Факторные признаки должны быть некоррелированы (отсутствие мультиколлинеарности), они предполагаются замеренными  точно и в их измерениях нет  автокорреляции, т.е. значения признаков  у одного объекта не должны зависеть от значений признаков у других объектов.[5]

     Изучение  связи между результативным и  двумя или более факторными признаками называется множественной регрессией. При исследовании зависимостей методами множественной регрессии ставят 2 задачи.

  1. определение аналитического выражения связи между результативным признаком у и фактическими признаками х1, х2, х3, …хк, т.е. найти функцию у=f(х1, х2, …хк)
  2. Оценка тесноты связи между результативным и каждым из факторных признаков.

     Корреляционно-регрессионная  модель (КРМ) – такое уравнение  регрессии, которое включает основные факторы, влияющие на вариацию результативного  признака.

     Построение  модели множественной регрессии  включает этапы:

  1. выбор формы  связи
  2. отбор факторных признаков
  3. обеспечение достаточного объема совокупности для получения верных оценок.
  1. все множество связей между  переменными, встречающиеся  на практике достаточно полно описывается функциями 5-ти видов:
  1. линейная:
  2. степенная:
  3. показательная:
  4. парабола:
  5. гипербола:

     Хотя все 5 функций присутствуют в практике КРА, наиболее часто используется линейная зависимость, как наиболее простая и легко поддающаяся интерпретации уравнение  линейной зависимости:     ,                                                                                               (2.5)

         где к – множество факторов включающихся в уравнение,

         bj – коэффициент условно-чистой регрессии, который показывает среднее по совокупности отклонение результативного признака от его среднего значения при отклонении фактора  xj от своей средней величины на единицу при условии, что все остальные факторы, входящие в уравнение сохраняют средние значения.[9]

         Параметры уравнения множественной регрессии  и определение  с помощью МНК.

           
     

            Пример: 
       

             
       

     0 – т.к. >0,7 следовательно на них  обращаем особое внимание ЭКО. Шкала тесноты связи:

     Если  связь  0 – 0,3 – слабая связь

                 0,3 – 0,5 – заметная

                 0,3 – 0,5 – тесная

                 0,7 – 0,9 – высокая

                 более 0,9 – весьма высокая

     Затем сравниваем два признака (доход и пол) <0,7, то включаем в уравнение множественной регрессии.

     Отбор факторов для включения в уравнение  множественной регрессии:

  1. между результативным и фактическим признаками должна быть причинно-следственная зависимость.
  2. результативный и фактический признаки должны быть тесно связаны между собой иначе возникает явление мультиколлинеарности (>06), т.е. включенные в уравнение факторные признаки влияют не только на результативный, но друг на друга, что влечет к неверной интерпретации числовых данных.

     Отбор факторов для модели осуществляется в два этапа. На первом идет анализ, по результатам которого исследователь  делает вывод о необходимости  рассмотрения тех или иных явлений  в качестве переменных, определяющих закономерности развития исследуемого процесса, на втором - состав предварительно отобранных факторов уточняется непосредственно  по результатам статистического  анализа.[1]

 

     Методы  отбора факторов для включения в  уравнение множественной регрессии:

  1. экспертный метод – основан на интуитивно логическом анализе который выполняется высококвалифицированными экспертами.
  2. использование матриц парных коэффициентов корреляции осуществляется  параллельно с первым методом, матрица симметрична относительно единичной диагонали.
  3. пошаговый регрессионный анализ – последовательное включение факторных признаков в уравнение регрессии и проверки значимости проводится на основании значений двух показателей на каждом шаге. Показатель корреляции, регрессии.

     Показатель  корреляции: рассчитывают изменение  теоретической корреляции отношения  или изменение средней остаточной дисперсии. Показатель регрессии –  изменение коэффициента условно  чистой регрессии.[14] 

       2.3. Проверка адекватности моделей, построенных на основе уравнений регрессии 

       Для практического использования моделей регрессии большое значение имеет  их адекватность, т.е. соответствие фактическим статистическим данным.

       Корреляционный и  регрессионный  анализ  обычно  (особенно  в  условиях  так называемого малого  и  среднего  бизнеса)  проводится  для  ограниченной  по объёму совокупности. Поэтому показатели регрессии и корреляции  –  параметры уравнения регрессии,  коэффициенты  корреляции  и  детерминации  могут  быть искажены  действием  случайных  факторов.  Чтобы  проверить,  насколько  эти показатели характерны для всей генеральной совокупности, не являются ли  они результатом   стечения   случайных   обстоятельств,   необходимо   проверить адекватность построенных статистических моделей.

       Проверка  адекватности моделей, построенных  на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии.[12]

       При численности  объектов  анализа  до  30  единиц  возникает  необходимость проверки значимости (существенности)  каждого  коэффициента  регрессии.  При этом выясняют насколько вычисленные  параметры  характерны  для  отображения комплекса  условий:  не   являются   ли   полученные   значения   параметров результатами действия случайных причин.

     Значимость  коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n<30) осуществляют с помощью t-критерия Стьюдента. При этом вычисляют  расчетные (фактические) значения t-критерия. 

                                                                                    (2.6) 
Для параметра a:

                                                                                (2.7) 
для параметра a1:
 

                                                                            (2.8) 
где - объём выборки;
 

     - среднее квадратическое отклонение  результативного признака от  выравненных значений ŷ;

       или                                     (2.9) 

     - среднее квадратическое отклонение  факторного признака от общей средней  .[8]

     Вычисленные по вышеприведенным формулам значения сравнивают с критическими , которые определяют по таблице Стьюдента с учетом принятого уровня значимости α и числом степеней свободы вариации  . В социально-экономических исследованиях уровень значимости α обычно принимают равным 0,05. Параметр признаётся значимым (существенным) при условии, если tрасч>tтабл . В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями.

       Параметр  модели признается статистически значимым, если tp>tкр

       Наиболее  сложным в этом выражении является определение дисперсии, которая  может быть рассчитана двояким способом.

       Наиболее  сложным этапом, завершающим регрессионный  анализ, является интерпретация уравнения, т.е. перевод его с языка статистики и математики на язык экономиста.

       Интерпретация моделей регрессии осуществляется методами той отрасли знаний, к  которой относятся исследуемые  явления. Но всякая интерпретация начинается со статистической оценки уравнения  регрессии в целом и оценки значимости входящих в модель факторных  признаков, т.е. с выяснения, как они  влияют на величину результативного  признака. Чем больше величина коэффициента регрессии, тем значительнее влияние  данного признака на моделируемый. Особое значение при этом имеет знак перед коэффициентом регрессии. Знаки коэффициентов регрессии  говорят о характере влияния  на результативный признак. Если факторный  признак имеет знак плюс, то с  увеличением данного фактора  результативный признак возрастает; если факторный признак со знаком минус, то с его увеличением результативный признак уменьшается.[12]

       Интерпретация этих знаков полностью определяется социально-экономическим содержанием  моделируемого (результативного) признака. Если его величина изменяется в сторону увеличения, то плюсовые знаки факторных признаков имеют положительное влияние. При изменении результативного призна-л-1 в сторону снижения положительное значение имеют минусовые знаки факторных признаков. Если экономическая теория подсказывает, что факторный признак должен иметь положительное значение, а он со знаком минус, то необходимо проверить расчеты параметров уравнения регрессии. Такое явление чаще всего бывает в силу допущенных ошибок при решении. Однако следует иметь в виду, что при анализе совокупного влияния факторов, при наличии взаимосвязей между ними характер их влияния может меняться. Для того чтобы быть уверенным, что факторный признак изменил знак влияния, необходима тщательная проверка решения данной модели, так как часто знаки могут меняться в силу допустимых ошибок при сборе или обработке информации.[4]

       При адекватности уравнения регрессии  исследуемому процессу возможны следующие  варианты.

       1. Построенная модель на основе  ее проверки по F-критерию Фишера  в целом адекватна, и все  коэффициенты регрессии значимы.  Такая модель может быть использована  для принятия решений к осуществлению  прогнозов.

       2. Модель по F-критерию Фишера адекватна,  но часть коэффициентов регрессии  незначима. В этом случае модель  пригодна для принятия некоторых  решений, но не для производства  прогнозов.

       3. Модель по F-критерию Фишера адекватна,  но все коэффициенты регрессии  незначимы. Поэтому модель полностью  считается неадекватной. На ее основе не принимаются решения и не осуществляются прогнозы.[12] 
 
 
 
 

       3. ПРИМЕНЕНИЕ РЕГРЕССИОННОГО АНАЛИЗА  ДЛЯ ИЗУЧЕНИЯ ОБЪЕКТА ИССЛЕДОВАНИЯ

Таблица 3.1.

Исходные  данные[15]

№ предприятия Объем добычи, тыс. т Численность рабочих, чел Стоимость основных фондов, тыс. у.е. Фондоотдача, тыс. т/ Производительность  труда
1 1275 240 10450 0,12 5,31
2 1250 210 7458 0,17 5,95
3 1054 264 9845 0,11 4
4 1513 240 8580 0,18 6,3
5 2214 276 9900 0,22 8,02
6 950 234 9790 0,1 4,06
7 1890 246 9350 0,2 7,68
8 2380 250 12650 0,19 9,52
9 2065 300 11290,4 0,18 6,88
10 1785 276 13200 0,14 6,47
11 1420 290 11200 0,13 4,9
12 1720 310 1460 1,18 5,55

Информация о работе Исследование регрессионного анализа в статистическом изучении взаимосвязи показателей