Исследование регрессионного анализа в статистическом изучении взаимосвязи показателей

Автор работы: Пользователь скрыл имя, 14 Марта 2011 в 21:56, курсовая работа

Описание работы

Целью курсовой работы является исследование регрессионного анализа в статистическом изучении взаимосвязи показателей.

Задачи курсовой работы:

- статистическое изучение взаимосвязи социально - экономических явлений и процессов;

- рассмотрение регрессионного анализа;

- исследование регрессионного анализа для изучения объекта исследования.

Файлы: 1 файл

ВВЕДЕНИЕрегрессия.docx

— 344.34 Кб (Скачать файл)

     В реальной общественной жизни ввиду  неполноты информации жестко детерминированной  системы, может возникнуть неопределенность, из-за которой эта система по своей  природе должна рассматриваться  как вероятностная, при этом связь  между признаками становится стохастической.

     Стохастическая  связь – это связь между величинами, при которой одна из них, случайная величина у, реагирует на изменение другой величины х или других величин х1…х(случайных или неслучайных) изменением закона распределения. Это обуславливается тем, что зависимая переменная (результативный признак), кроме рассматриваемых независимых, подвержена влиянию ряда неучтенных или неконтролируемых (случайных) факторов, а также некоторых неизбежных ошибок измерения переменных. Поскольку значения зависимой переменной подвержены случайному разбросу, они не могут быть предсказаны с достаточной точностью, а только указаны с определенной вероятностью.

     Характерной особенностью стохастических связей является то, что они проявляются во всей совокупности, а не в каждой ее единице. Причём неизвестен ни полный перечень факторов, определяющих значение результативного  признака, ни точный механизм их функционирования и взаимодействия с результативным признаком. Всегда имеет место влияние  случайного. Появляющиеся различные  значения зависимой переменной –  реализация случайной величины.[5]

     Проявление  стохастических связей подвержено действию закона больших чисел: лишь в достаточно большом числе единиц индивидуальные особенности сгладятся, случайности взаимопогасятся, и зависимость, если она имеет существенную силу, проявится достаточно отчётливо.

     Корреляционная  связь существует там, где взаимосвязанные явления характеризуются только случайными величинами. При такой связи среднее значение (математическое ожидание) случайной величины результативного признака у закономерно изменяется в зависимости от изменения другой величины х или других случайных величин х1…хn. Корреляционная связь проявляется не в каждом отдельном случае, а во всей совокупности в целом. Только при достаточно большом количестве случаев каждому значению случайного признака х будет соответствовать распределение средних значений случайного признака у. Наличие корреляционных связей присуще многим общественным явлениям.

     Корреляционная  связь – понятие более узкое, чем стохастическая связь. Последняя может отражаться не только в изменении средней величины, но и в вариации одного признака в зависимости от другого, то есть любой другой характеристики вариации. Таким образом, корреляционная связь является частным случаем стохастической связи.[8]

     Прямые  и обратные связи. В зависимости от направления действия, функциональные и стохастические связи могут быть прямые и обратные. При прямой связи направление изменения результативного признака совпадает с направлением изменения признака-фактора, то есть с увеличением факторного признака увеличивается и результативный, и, наоборот, с уменьшением факторного признака уменьшается и результативный признак. В противном случае между рассматриваемыми величинами существуют обратные связи. Например, чем выше квалификация рабочего (разряд), тем выше уровень производительности труда – прямая связь. А чем выше производительность труда, тем ниже себестоимость единицы продукции – обратная связь.

     Прямолинейные и криволинейные связи. По аналитическому выражению (форме) связи могут быть прямолинейными и криволинейными. При прямолинейной связи с возрастанием значения факторного признака происходит непрерывное возрастание (или убывание) значений результативного признака. Математически такая связь представляется уравнением прямой, а графически – прямой линией. Отсюда ее более короткое название – линейная связь. При криволинейных связях с возрастанием значения факторного признака возрастание (или убывание) результативного признака происходит неравномерно, или же направление его изменения меняется на обратное. Геометрически такие связи представляются кривыми линиями (гиперболой, параболой и т.д.).[14]

     Однофакторные и многофакторные связи. По количеству факторов, действующих на результативный признак, связи различаются: однофакторные (один фактор) и многофакторные (два и более факторов). Однофакторные (простые) связи обычно называются парными (т.к. рассматривается пара признаков). Например, корреляционная связь между прибылью и производительностью труда. В случае многофакторной (множественной) связи имеют в виду, что все факторы действуют комплексно, то есть одновременно и во взаимосвязи. Например, корреляционная связь между производительностью труда и уровнем организации труда, автоматизации производства, квалификации рабочих, производственным стажем, простоями и другими факторными признаками. С помощью множественной корреляции можно охватить весь комплекс факторных признаков и объективно отразить существующие множественные связи.[12]

     Для исследования стохастических связей широко используется метод сопоставления  двух параллельных рядов, метод аналитических  группировок, корреляционный анализ, регрессионный  анализ и некоторые непараметрические  методы.

     Метод сопоставления двух параллельных рядов является одним из простейших методов. Для этого факторы, характеризующие результативный признак располагают в возрастающем или убывающем порядке (в зависимости от эволюции процесса и цели исследования), а затем прослеживают изменение величины результативного признака. Сопоставление и анализ расположенных таким образом рядов значений изучаемых величин позволяют установить наличие связи и ее направление. Зависимость между факторами и показателями может прослеживаться во времени (параллельные динамические ряды).

     Метод аналитических группировок тоже относится к простейшим методам. Чтобы выявить зависимость с помощью этого метода, нужно произвести группировку единиц совокупности по факторному признаку и для каждой группы вычислить среднее или относительное значение результативного признака. Сопоставляя затем изменения результативного признака по мере изменения факторного можно выявить направление, характер и тесноту связи между ними.[14]

     В общем виде задача статистики в области  изучения взаимосвязей состоит не только в количественной оценке их наличия, направления и силы связи, но и  в определении формы (аналитического выражения) влияния факторных признаков  на результативный. Для ее решения  применяют методы корреляционного  и регрессионного анализа.

     Задачи корреляционного анализа сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных причинных связей (причинный характер которых должен быть выяснен с помощью теоретического анализа) и оценки факторов, оказывающих наибольшее влияние на результативный признак.

     Задачами регрессионного анализа являются выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчётных значений зависимой переменной (функции регрессии).

     Решение всех названных задач приводит к  необходимости комплексного использования  этих методов.

     Корреляционный  и регрессионный анализ. Исследование связей в условиях массового наблюдения и действия случайных факторов осуществляется, как правило, с помощью экономико-статистических моделей. В широком смысле модель – это аналог, условный образ (изображение, описание, схема, чертёж и т.п.) какого-либо объекта, процесса или события, приближенно воссоздающий «оригинал». Модель представляет собой логическое или математическое описание компонентов и функций, отображающих существенные свойства моделируемого объекта или процесса, даёт возможность установить основные закономерности изменения оригинала. В модели оперируют показателями, исчисленными для качественно однородных массовых явлений (совокупностей). Выражение и модели в виде функциональных уравнений используют для расчёта средних значений моделируемого показателя по набору заданных величин и для выявления степени влияния на него отдельных факторов.[12]

     По  количеству включаемых факторов модели могут быть однофакторными и многофакторными (два и более факторов).

     В зависимости от познавательной цели статистические модели подразделяются на структурные, динамические и модели связи.

     Двухмерная  линейная модель корреляционного и  регрессионного анализа (однофакторный  линейный корреляционный и регрессионный  анализ). Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации факторного анализа х на результативный признак у и представляющая собой однофакторный корреляционный и регрессионный анализ. Овладение теорией и практикой построения и анализа двухмерной модели корреляционного и регрессионного анализа представляет собой исходную основу для изучения многофакторных стохастических связей.[3]

     Важнейшим этапом построения регрессионной модели (уравнения регрессии) является установление в анализе исходной информации математической функции. Сложность заключается  в том, что из множества функций необходимо найти такую, которая лучше других выражает реально существующие связи между анализируемыми признаками. Выбор типов функции может опираться на теоретические знания об изучаемом явлении, опят предыдущих аналогичных исследований, или осуществляться эмпирически – перебором и оценкой функций разных типов и т.п.

     При изучении связи экономических показателей  производства (деятельности) используют различного вида уравнения прямолинейной  и криволинейной связи. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что  в большинстве случаев нелинейные формы связи для выполнения расчётов преобразуют (путём логарифмирования или замены переменных) в линейную форму. Уравнение однофакторной (парной) линейной корреляционной связи имеет  вид:

     ŷ = a+ a1x ,

     где ŷ - теоретические значения результативного признака, полученные по уравнению регрессии;

     a, a- коэффициенты (параметры) уравнения регрессии.

     Поскольку aявляется средним значением у в точке х=0, экономическая интерпретация часто затруднена или вообще невозможна.

     Коэффициент парной линейной регрессии aимеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Вышеприведенное уравнение показывает среднее значение изменения результативного признака у при изменении факторного признака х на одну единицу его измерения, то есть вариацию у, приходящуюся на единицу вариации х. Знак aуказывает направление этого изменения.[7]

     Параметры уравнения a, aнаходят методом наименьших квадратов (метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений), то есть в основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных yот выровненных ŷ :

     S(y– ŷ)S(y– a– a1xi)® min

     Для нахождения минимума данной функции  приравняем к нулю ее частные производные  и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:

                      (2.1)

              
     
     

Решим эту систему  уравнений в общем виде: 

                                                                    (2.2) 

       
или

               

                                                                                       (2.3) 

       Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующей формуле, дающим тот же результат:

                                                                                         (2.4) 

     Определив значения a, aи подставив их в уравнение связи ŷ = a+ a1x , находим значения ŷ , зависящие только от заданного значения х.[11] 
 
 

       2.2. Отбор факторных признаков для построения множественной регрессионной модели 

       Регрессионный анализ наиболее широко используемый метод многомерного статистического  анализа. Термин ''множественная регрессия'' объясняется тем, что анализу  подвергается зависимость одного признака (результирующего) от набора независимых (факторных) признаков. Разделение признаков  на результирующий и факторные осуществляется исследователем на основе содержательных представлений об изучаемом явлении (процессе). Все признаки должны быть количественными (хотя допускается  и использование дихотомических признаков, принимающих лишь два  значения, например 0 и 1).

Информация о работе Исследование регрессионного анализа в статистическом изучении взаимосвязи показателей