Этапы проведения корреляционного анализа

Автор работы: Пользователь скрыл имя, 10 Декабря 2012 в 15:11, реферат

Описание работы

Многофакторный корреляционный анализ позволяет установить наличие, тесноту и форму связи между факторами и изучаемым показателем. Он состоит из нескольких этапов, деление на которые условно, так как отдельные стадии тесно связаны между собой.
Рассмотрим эти этапы.
1. На первом этапе определяются цели и задачи исследования и на основе качественного анализа подбираются факторы, которые предположительно влияют на изучаемый показатель.

Файлы: 1 файл

реферат 1.doc

— 142.50 Кб (Скачать файл)

Этапы проведения корреляционного  анализа

 

Многофакторный  корреляционный анализ позволяет установить наличие, тесноту и форму связи  между факторами и изучаемым  показателем. Он состоит из нескольких этапов, деление на которые условно, так как отдельные стадии тесно связаны между собой.

Рассмотрим  эти этапы.

1. На первом этапе определяются цели и задачи исследования и на основе качественного анализа подбираются факторы, которые предположительно влияют на изучаемый показатель.

При их подборе  необходимо учитывать:

– наличие причинно-следственных связей между показателями;

– значимость факторов, то есть степень их влияния на результативный показатель;

– возможность количественного измерения фактора.

2. На втором этапе осуществляется сбор и первичная обработка исходной информации.

Совокупность  данных должна быть достаточно большой. Информация должна соответствовать  закону нормального распределения, согласно которому основная масса наблюдений по каждому показателю должна быть сгруппирована около его среднего значения.

Исходные  данные должны быть качественно и  количественно однородны. Качественная однородность предполагает приблизительно одинаковые условия и специфику  формирования факторных и результативного  признаков. Количественная однородность заключается в отсутствии таких наблюдений, которые значительно (аномально) отличаются от основной массы данных.

Критерием однородности информации служит среднеквадратическое отклонение и коэффициент вариации, которые рассчитываются по каждому  факторному и результативному показателю. Среднеквадратическое отклонение показывает абсолютное отклонение индивидуальных значений от среднеарифметической, а коэффициент вариации характеризует относительную меру отклонения отдельных значений от среднеарифметической. Причем, чем больше коэффициент вариации, тем относительно больший разброс данных в совокупности.

Изменчивость  вариационного ряда принято считать:

незначительной, если вариация не превышает 10%;

средней, если вариация составляет 10-20%;

значительной, если она больше 20%, но не превышает 33%. Если вариация больше 33 %, то следует исключить из выборки нетипичные наблюдения.

3. На третьем этапе осуществляется моделирование связей между факторами и результативным признаком, т.е. решается вопрос о выборе формы связи.

На основе экономического и логического анализа природы и сущности изучаемого явления подбирается тип математического уравнения, которое наилучшим образом отражает характер изучаемых зависимостей.

Обоснование уравнения связи проводится с  помощью группировки данных, построения графика и т.д.

Размещение  точек на графике показывает, какая  зависимость образовалась: прямолинейная  или криволинейная.

Для парной корреляции прямолинейную зависимость описывает  уравнение прямой

 

у = ao + a1x1,а для множественной корреляции - уравнение линейной функции

у = ао + а1х1 + а2х2 + … + аnхn,

 

где у - результативный показатель;

ао - постоянная величина, которая не связана с изменением факторов;

аi - коэффициенты при переменных в уравнении регрессии;

хi - факторные  показатели (переменные).

Криволинейные зависимости в экономических исследованиях встречаются реже. Они могут быть описаны уравнением

 

параболы (у = а + bх + сх ²);

гиперболы (у = а + b/х);

 

степенной, показательной  и других функций.

Например, при  увеличении возраста рабочих до определенного уровня наблюдается рост их производительности, а затем ее снижение. Такая зависимость может быть описана уравнением параболы второго порядка:

 

у = а + bх + сх².

 

В случаях, когда  трудно обосновать форму зависимости, решение задачи можно провести по разным моделям и сравнить полученные результаты. Наилучший вариант выбирается после оценки их по специальным критериям.

4. На четвертом этапе проводится расчет численных значений параметров регрессионного уравнения. Он осуществляется методом наименьших квадратов, при котором в случае прямолинейной зависимости прямая на графике пройдет наиболее близко к точкам фактических наблюдений. Для того решается система нормальных уравнений.

Построение  уравнения регрессии проходит шаговым  способом. При этом существуют два  варианта:

а) сначала  в расчет принимается один фактор, который является наиболее значимым, потом добавляется второй, третий и т.д. На каждом шаге рассчитываются уравнение связи, множественный  коэффициент корреляции, коэффициент  детерминации и статистические показатели, характеризующие надежность уравнения связи. Чем выше величины коэффициентов корреляции и лучше статистические характеристики, тем точнее уравнение связи описывает изучаемые зависимости. Если добавление новых факторов не улучшает оценочные показатели, то их надо отбросить и остановиться на том уравнении, где эти показатели наиболее оптимальны.

б) при втором варианте решение модели происходит в обратном порядке путем последовательного  исключения наименее значимых факторов.

5. На пятом этапе дается статистическая оценка уравнения связи и экономическая интерпретация результатов корреляционного анализа.

Показатели оценки уравнения  связи и экономическая интерпретация  результатов корреляционного анализа

 

Показатели  корреляции и регрессии, рассчитанные для определенного количества наблюдений, могут быть искажены действием случайных факторов. Для оценки надежности уравнения связи используют следующие критерии:

критерий  Стьюдента (t);

критерий  Фишера (F);

средняя ошибка аппроксимации;

коэффициенты  множественной корреляции и детерминации.

Как уже отмечалось, эти показатели рассчитываются на каждом шаге построения уравнения регрессии.

Для оценки значимости коэффициентов корреляции используется t - критерий Стьюдента. При этом для каждого коэффициента расчетное значение t-критерия сравнивается с табличным, которое находится по таблице значений критериев Стьюдента. Если расчетное значение выше табличного, то величина коэффициента корреляции является значимой, а изучаемая связь между результативным показателем и факторами надежной. Также t-критерий Стьюдента используется для оценки значимости параметров уравнения регрессии. В этом случае его расчет проводится по другим формулам, а выводы делаются аналогично предыдущим.

Значимость  и существенность регрессионного уравнения оценивается с помощью F-критерия Фишера, определяемого отношением общей дисперсии к остаточной. Для этого фактическая (рассчитанная) величина F-критерия сравнивается с табличной. Табличное значение определяется для принятого уровня значимости * (обычно * = 0,05) и количестве степеней свободы, которое рассчитывают по формуле

 

(m-1) / (n-m),

 

где m - количество параметров в уравнении связи (вместе с "y");

n - количество  наблюдений.

Если F-критерий фактический больше F-критерия табличного, то уравнение регрессии значимо, а связь между изучаемым показателем и факторами существенна.

Средняя ошибка аппроксимации используется для  статистической оценки точности уравнения  связи и характеризует степень  совпадения фактических (наблюдаемых) и расчетных значений результативного показателя.

Чем меньше теоретическая  линия регрессии, рассчитанная по уравнению, отклоняется от фактической (эмпиричной), тем меньше средняя ошибка аппроксимации. В экономических расчетах допускается  погрешность до 5-8%, в этом случае исследуемое уравнение связи довольно точно описывает изучаемые зависимости.

Полноту связи  характеризуют:

а) множественный коэффициент корреляции, отражающий тесноту связи или силу совместного воздействия факторов на величину "y";

б) коэффициент детерминации, равный квадрату коэффициента корреляции. Он показывает на сколько процентов вариация результативного показателя зависит от изменения выбранных факторов.

После того, как  уравнение связи признано надежным, адекватным, а связь между изучаемым  показателем и факторами достаточно тесной и полной, можно приступать к интерпретации результатов корреляционного анализа, т.е. их объяснению.

1. В линейной модели коэффициенты при переменных в уравнении связи показывают, на сколько единиц собственного измерения изменяется функция при увеличении факторного показателя на единицу собственного измерения при неизменных значениях остальных аргументов.

2. Переменные в уравнении регрессии имеют разные единицы измерения, что делает их несопоставимыми с точки зрения степени воздействия факторов на результативный показатель. Чтобы привести их в сопоставимый вид рассчитываются стандартизированные коэффициенты регрессии или ß - коэффициенты.

ß-коэффициент показывает, на сколько средних квадратических отклонений изменится функция с увеличением фактора на одно среднеквадратическое отклонение.

По абсолютной величине ß - коэффициентов можно судить в какой последовательности находятся факторы по степени их воздействия на функцию.

3. С этой же целью рассчитываются и коэффициенты эластичности, которые позволяют провести анализ в процентном измерении. Коэффициент эластичности показывает, на сколько процентов в среднем изменится функция с ростом фактора на 1 процент при фиксированных значениях других факторов.

корреляционный  анализ линейное программирование

Методика применения корреляционного анализа

 

Многофакторный  корреляционный анализ играет важную роль в экономических исследованиях, так как позволяет:

1) изучить  закономерности изменения результативного  показателя в зависимости от  разных факторов;

2) определить  уровень внутрихозяйственных резервов;

3) спрогнозировать  уровень изучаемого показателя.

Для определения  резервов увеличения или снижения изучаемого экономического показателя за счет i-го фактора величина изменения этого фактора умножается на соответствующий ему коэффициент в уравнении регрессии (с его знаком).

 

∆у (х) =a×∆x,

 

где а - коэффициент в уравнении регрессии при i-м факторе;

Dx - отклонение i-го фактора.

При прогнозировании  величины результативного показателя в уравнение связи подставляют  плановые (прогнозируемые) значения факторных  показателей. При этом

предполагается, что форма взаимосвязи будет  неизменной на весь период прогнозирования.

Рассмотрим  последовательность применения корреляционного  анализа на конкретном примере.

Необходимо  провести корреляционный анализ уровня рентабельности продукции предприятия  по данным за 3 года, т.е. за 36 месяцев.

На основе предварительного анализа были отобраны следующие факторы:

 - материалоотдача, руб.;

 - фондоотдача, руб.;

 - среднегодовая выработка 1 работника, млн. руб.;

 - период оборота оборотных активов, дни;

 - удельный вес продукции высшей категории качества, %.

Информация  о рентабельности и выбранных факторах была собрана за 36 месяцев, что соответствует требованию необходимого объема выборки данных.

Проверка  информации на соответствие закону нормального  распределения показала, что она  соответствует требуемым критериям.

Изучение  взаимосвязей между уровнем рентабельности и факторами показало, что все зависимости имеют прямолинейный характер, поэтому для уравнения связи была выбрана линейная функция.

Решение задачи корреляционного анализа проводилось  на компьютере по типовым программам. Исходные данные были представлены в матричной форме и введены в компьютер. Расчет проводился шаговым способом с добавлением на каждом шаге нового фактора и оценкой всех статистических характеристик коэффициентов корреляции и уравнения связи.

В результате на пятом шаге было получено уравнение регрессии:

 

У = 0,49+3,65+0,09×+1,02×-0,122×+0,052×.

 

Значения * - коэффициентов составили:

 

0,359; 0,275; 0,213; - 0,118; 0,133;

 

Значения  коэффициентов эластичности составили:

 

0,374; 0,308; 0,318; - 0,080; 0,001.

 

Прежде, чем  преступить к анализу полученных результатов и их практическому  применению, необходимо убедиться в  надежности уравнения связи.

Величина F-критерия Фишера, равная 95,67, оказалась выше табличного значения, следовательно, уравнение  регрессии значимо.

Средняя ошибка аппроксимации составила 3,64 %, что  допустимо в экономических исследованиях, поэтому полученное уравнение связи  довольно точно описывает изучаемые  зависимости.

Множественный коэффициент корреляции составил 0,92, что характеризует связь между уровнем рентабельности и выбранными факторами как достаточно тесную.

Коэффициент детерминации составил 0,85. Это значит, что вариация рентабельности на 85% зависит  от изменения выбранных факторов, а на долю неучтенных факторов приходится 15%. Таким образом, данное уравнение регрессии может быть использовано в практических целях.

Информация о работе Этапы проведения корреляционного анализа