Автор работы: Пользователь скрыл имя, 10 Мая 2012 в 19:33, курсовая работа
В ходе своей работы я ставлю такие цели как:
- рассмотреть основные задачи и предпосылки применения корреляционно-регрессивного анализа.
- закpепить теоpетические знания веpоятностного анализа двухмеpных случайных величин ;
- изучить и пpиобpести пpактические навыки пpименения основных методов математической статистики для пpедставления и оценки хаpактеpистик выбоpок,опpеделения законов pаспpеделения,пpовеpки статистических гипотез и установление хаpактеpа связи между двумя величинами;
- исследование веpоятностных свойств функции случайных аpгументов сpедствами коppеляционно-pегpессионного анализа.
Ведение…………………………………………………………………………….3
1.Коэффициент корреляции………………………………………………………5
1.1. Коэффициент корреляции Пирсона………………………………...5
1.2. Коэффициент ранговой корреляции Кенделла…………………….6
1.3. Коэффициент ранговой корреляции Спирмена……………………7
1.4 .Коэффициент корреляции знаков Фехнера………………………...8
1.5.Коэффициент множественной ранговой корреляции………….......8
2. Основные понятия корреляционного и регрессионного анализа………….10
2.1.Корреляционный анализ…………………………………………...11
2.2.Ложная корреляция……………………………………………..….11
2.3.Корреляционные связи……………………………………………..12
2.4.Регрессионный анализ……………………………………………...13
3. Пакет анализа Microsoft Excel………………………………………………..17
4. Характеристика метода корреляционно-регрессионного анализа………...19
5. Задачи корреляционно-регрессивного анализа и моделирования…………25
Заключение……………………………………………………………………….29
Библиографический список……………………...………………………….
Содержание:
Ведение……………………………………………………………
1.Коэффициент корреляции……………………………………………………
1.1. Коэффициент корреляции Пирсона………………………………...5
1.2. Коэффициент ранговой корреляции Кенделла…………………….6
1.3. Коэффициент ранговой корреляции Спирмена……………………7
1.4 .Коэффициент корреляции знаков Фехнера………………………...8
1.5.Коэффициент множественной ранговой корреляции………….......8
2. Основные понятия корреляционного и регрессионного анализа………….10
2.1.Корреляционный анализ…………………………………………...11
2.2.Ложная корреляция……………………………………………..…
2.3.Корреляционные связи……………………………………………..12
2.4.Регрессионный анализ……………………………………………...13
3. Пакет анализа Microsoft Excel………………………………………………..17
4. Характеристика метода корреляционно-регрессионного анализа………...19
5. Задачи корреляционно-регрессивного анализа и моделирования…………25
Заключение……………………………………………………
Библиографический список……………………...…………………………...
ВВЕДЕНИЕ
Обработка статистических данных уже давно применяется в самых разнообразных видах человеческой деятельности. Вообще говоря, трудно назвать ту сферу, в которой она бы не использовалась. Но, пожалуй, ни в одной области знаний и практической деятельности обработка статистических данных не играет такой исключительно большой роли, как в экономике, имеющей дело с обработкой и анализом огромных массивов информации в социально-экономических явлениях и процессах. Всесторонний и глубокий анализ этой информации, так называемых статистических данных, предполагает использование различных специальных методов, важное место среди которых занимает корреляционный и регрессионный анализы обработки статистических данных.
В экономических исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методами корреляционного и регрессионного анализа. Для достоверного отображения объективно существующих в экономике процессов необходимо выявить существенные взаимосвязи и не только выявить, но и дать им количественную оценку. Этот подход требует вскрытия причинных зависимостей.
Под причинной зависимостью понимается такая связь между процессами, когда изменение одного из них является следствием изменения другого.
Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии и силе корреляционной связи. Не все факторы, влияющие на экономические процессы, являются случайными величинами, поэтому при анализе экономических явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.
Использование возможностей современной вычислительной техники, оснащенной пакетами программ машинной обработки статистической информации на ЭВМ, делает практически осуществимым оперативное решение задач изучения взаимосвязи показателей биржевых ставок методами корреляционно-регрессионного анализа.
При машинной обработке исходной информации на ЭВМ, оснащенных пакетами стандартных программ ведения анализов, вычисление параметров применяемых математических функций является быстро выполняемой счетной операцией.
Актуальность темы заключается в том, что статистические распределения характеризуются наличием более или менее значительной вариации в величине признака у отдельных единиц совокупности. Естественно, возникает вопрос о том, какие же причины формируют уровень признака в данной совокупности и каков конкретный вклад каждой из них. Изучение зависимости вариации признака от окружающих условий и составляет содержание теории корреляции.
Изучение действительности показывает, что вариация каждого научаемого признака находится в тесной связи и взаимодействии с вариацией других признаков, характеризующих исследуемую совокупность единиц. Вариация уровня производительности труда работников предприятий зависит от степени совершенства применяемого оборудования, технологии, организации производства, труда и управления и других самых различных факторов.
В ходе своей работы я ставлю такие цели как:
- рассмотреть основные задачи и предпосылки применения корреляционно-регрессивного анализа.
- закpепить теоpетические знания веpоятностного анализа двухмеpных случайных величин ;
- изучить и пpиобpести пpактические навыки пpименения основных методов математической статистики для пpедставления и оценки хаpактеpистик выбоpок,опpеделения законов pаспpеделения,пpовеpки статистических гипотез и установление хаpактеpа связи между двумя величинами;
- исследование веpоятностных свойств функции случайных аpгументов сpедствами коppеляционно-pегpессионного анализа.
1. Коэффициент корреляции
Термин «корреляция» был введен в науку выдающимся английским естествоиспытателем Френсисом Гальтоном в 1886 г.
Коэффициент корреляции или парный коэффициент корреляции в теории вероятностей и статистике — это показатель характера взаимного стохастического влияния изменения двух случайных величин. Коэффициент корреляции обозначается латинской буквой R в математической статистике (r в статистике) и может принимать значения от −1 до +1. Если значение по модулю находится ближе к 1, то это означает наличие сильной связи, а если ближе к 0 — связь слабая или вообще отсутствует. При коэффициенте корреляции равном по модулю единице говорят о функциональной связи (а именно линейной зависимости), то есть изменения двух величин можно описать математической функцией.
В различных прикладных отраслях (социологии, демографии, медицине, физике, химии, экономике и др.) приняты разные границы интервалов для оценки тесноты и значимости связи.
1.1. Коэффициент корреляции Пирсона.
Для метрических величин применяется коэффициент корреляции Пирсона: точную формулу для подсчета коэффициента корреляции разработал ученик Френсиса Гальтона Карл Пирсон.
Пусть X,Y — две случайные величины, определённые на одном вероятностном пространстве. Тогда их коэффициент корреляции задаётся формулой:
где cov — ковариация, D — дисперсия.
Коэффициент характеризует наличие только линейной связи между признаками, обозначаемыми, как правило, символами X и Y. Формула расчета коэффициента корреляции построена таким образом, что, если связь между признаками имеет линейный характер, коэффициент Пирсона точно устанавливает тесноту этой связи. Поэтому он называется также коэффициентом линейной корреляции Пирсона. Если же связь между переменными X и Y не линейна, то Пирсон предложил для оценки тесноты этой связи так называемое корреляционное отношение.
Величина коэффициента линейной корреляции Пирсона не может превышать +1 и быть меньше чем -1. Эти два числа +1 и -1 — являются границами для коэффициента корреляции. Когда при расчете получается величина большая +1 или меньшая -1 — следовательно произошла ошибка в вычислениях.
Знак коэффициента корреляции очень важен для интерпретации полученной связи. Подчеркнем еще раз, что если знак коэффициента линейной корреляции — плюс, то связь между коррелирующими признаками такова, что большей величине одного признака (переменной) соответствует большая величина другого признака (другой переменной). Иными словами, если один показатель (переменная) увеличивается, то соответственно увеличивается и другой показатель (переменная). Такая зависимость носит название прямо пропорциональной зависимости. Если же получен знак минус, то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости.
1.2.Коэффициент ранговой корреляции Кенделла.
Применяется для выявления взаимосвязи между количественными или качественными показателями, если их можно ранжировать. Значения показателя X выставляют в порядке возрастания и присваивают им ранги. Ранжируют значения показателя Y и рассчитывают коэффициент корреляции Кенделла:
,
где S = P − Q.
P — суммарное число наблюдений, следующих за текущими наблюдениями с большим значением рангов Y.
Q — суммарное число наблюдений, следующих за текущими наблюдениями с меньшим значением рангов Y. (равные ранги не учитываются).
Если исследуемые данные повторяются (имеют одинаковые ранги), то в расчетах используется скорректированный коэффициент корреляции Кенделла:
;
t — число связанных рангов в ряду X и Y соответственно.
1.3.Коэффициент ранговой корреляции Спирмена.
Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.
Практический расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:
1) Сопоставать каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию).
2) Определить разности рангов каждой пары сопоставляемых значений.
3) Возвести в квадрат каждую разность и суммировать полученные результаты.
4) Вычислить коэффициент корреляции рангов по формуле:
где - сумма квадратов разностей рангов, а n - число парных наблюдений.
1.4.Коэффициент корреляции знаков Фехнера.
Подсчитывается количество совпадений и несовпадений знаков отклонений значений показателей от их среднего значения.
;
U — число пар, у которых знаки отклонений значений от их средних совпадают.
V — число пар, у которых знаки отклонений значений от их средних не совпадают.
1.5.Коэффициент множественной ранговой корреляции (Конкордации):
m — число групп, которые ранжируются.
n — число переменных.
Rij — ранг i-фактора у j-единицы.
Коэффициент конкордации используется для определения взаимосвязи (согласованности) оценок экспертов.
Можно выделить 2 ограничения в использовании коэффициент конкордации Кендала:
1)невозможность рассчитать согласованность мнений экспертов по каждой переменной в отдельности.
2)коэффициент измеряет согласованность мнений в смысле их коррелированности, но не совпадения.
2.Основные понятия корреляционного и регрессионного анализа.
Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики.
В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др.
Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей.
Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ.
Корреляционно-регрессионный анализ считается одним из главных методов в маркетинге, наряду с оптимизационными расчетами, а также математическим и графическим моделированием трендов (тенденций). Широко применяются как однофакторные, так и множественные регрессионные модели.
Теперь подробнее рассмотрим корреляционный и регрессионный анализы каждый в отдельности.
2.1. Корреляционный анализ
Корреляционный анализ — метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными. При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков для установления между ними статистических взаимосвязей.
Цель корреляционного анализа — обеспечить получение некоторой информации об одной переменной с помощью другой переменной. В случаях, когда возможно достижение цели, говорят, что переменные коррелируют. В самом общем виде принятие гипотезы о наличии корреляции означает что изменение значения переменной А, произойдет одновременно с пропорциональным изменением значения Б.
Корреляция отражает лишь линейную зависимость величин, но не отражает их функциональной связности. Например, если вычислить коэффициент корреляции между величинами A = sin(x) и B = cos(x), то он будет близок к нулю, то есть зависимость между величинами отсутствует. Между тем, величины A и B очевидно связаны функционально по закону sin2(x) + cos2(x) = 1.
2.2.Ложная корреляция
Часто заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи между парами признаков, в то время как коэффициенты корреляции устанавливают лишь статистические взаимосвязи.
В современной количественной методологии социальных наук, фактически, произошел отказ от попыток установить причинно-следственные связи между наблюдаемыми переменными эмпирическими методами. Поэтому, когда исследователи в социальных науках говорят об установлении взаимосвязей между изучаемыми переменными, подразумевается либо общетеоретическое допущение, либо статистическая зависимость.
2.3.Корреляционные связи.
Корреляционные связи различаются по форме, направлению и степени (силе).
По форме корреляционная связь может быть прямолинейной или криволинейной. Прямолинейной может быть, например, связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии. Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи (см. рис. 1). При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности.
Рис.1. Связь между эффективностью решения задачи.
По направлению корреляционная связь может быть положительной ("прямой") и отрицательной ("обратной"). При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака - низкие значения другого. При отрицательной корреляции соотношения обратные. При положительной корреляции коэффициент корреляции имеет положительный знак, например r=+0,207, при отрицательной корреляции - отрицательный знак, например r=—0,207.
Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции.
Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.
Максимальное возможное абсолютное значение коэффициента корреляции r=1,00; минимальное r=0,00.
Общая классификация корреляционных связей (по Ивантер Э.В., Коросову А.В., 1992): сильная, или тесная при коэффициенте корреляции r>0,70;
средняя
умеренная
слабая
очень слабая
2.4.Регрессионный анализ
Регрессионный анализ - это группа методов, направленных на выявление и математическое выражение тех изменений и зависимостей, которые имеют место в системе случайных величин. Если такая система моделирует педагогическую, то, следовательно, путем регрессионного анализа выявляются и математически выражаются психолого-педагогические явления и зависимости между ними. Характеристики этих явлений измеряются в разных шкалах, что накладывает ограничения на способы математического выражения изменений и зависимостей, которые изучаются педагогом-исследователем.
Методы регрессионного анализа рассчитаны, главным образом, на случай устойчивого нормального распределения, в котором изменения от опыта к опыту проявляются лишь в виде независимых испытаний.
Выделяются различные формальные задачи регрессионного анализа. Они могут быть простыми или сложными по формулировкам, по математическим средствам и трудоемкости. Перечислим и рассмотрим на примерах те из них, которые представляются основными.
Первая задача — выявить факт изменчивости изучаемого явления при определенных, но не всегда четко фиксированных условиях. В предыдущей лекции мы уже решали эту задачу с помощью параметрических и непараметрических критериев.
Вторая задача — выявить тенденцию как периодическое изменение признака. Сам по себе этот признак, может быть, зависим или не зависим от переменной-условия (он может зависеть от неизвестных или неконтролируемых исследователем условий). Но это не важно для рассматриваемой задачи, которая ограничивается лишь выявлением тенденции и ее особенностей.
Проверка гипотез об отсутствии или наличии тенденции может выполняться с использованием критерия Аббе. Критерий Аббе предназначен для проверки гипотез о равенстве средних значений, установленных для 4<n<60 взаимно независимых нормально распределенных выборок.
Эмпирическое значение критерия Аббе вычисляется по формуле:
Критерий Аббе может найти широкое применение в психолого-педагогических исследованиях. Рассмотрим пример выявления тенденции с помощью критерия Аббе.
В табл.1 представлена динамика процента студентов IV курса, на «отлично» сдававших экзамены в зимние сессии на протяжении 10 лет работы одного из факультетов университета. Требуется установить, есть ли тенденция к повышению успеваемости.
Учебный год
| %
|
1995-96 | 10,8
|
1996-97 | 16,4
|
1997-98 | 17,4
|
1998-99
| 22,0 |
1999-00 | 23,0
|
2000-01 | 21,5
|
2001-02 | 26,1
|
2002-03 | 17,2
|
2003-04 | 27,5
|
2004-05
| 33,0 |
Таблица 1. Динамика процента отличников четвертого курса за 10 лет работы факультета.
В качестве нулевой проверяем гипотезу об отсутствии тенденции, т. е. о равенстве процентов.
Усредняем проценты, приведенные в табл.1, находим, что =21,5. Вычисляем разности между последующими и предыдущими значениями в выборке, возводим их в квадрат и суммируем:
Аналогично вычисляет знаменатель в формуле, суммируя квадраты разностей между каждым измерением и средним арифметическим:
Теперь по формуле получаем:
В таблице критерия Аббе находим, что при n=10 и уровне значимости 0,05 критическое значение , что больше полученного нами 0,41, следовательно гипотезу о равенстве процента «отличников» приходится отклонить, и можно принять альтернативную гипотезу о наличии тенденции.
3.Пакет анализа Microsoft Excel
В состав Microsoft Excel входит набор средств анализа данных (так называемый пакет анализа), предназначенный для решения сложных статистических и инженерных задач. Для проведения анализа данных с помощью этих инструментов следует указать входные данные и выбрать параметры; анализ будет проведен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон.
Корреляция - один из инструментов пакета анализа Microsoft Excel. Используется для количественной оценки взаимосвязи двух наборов данных, представленных в безразмерном виде. Коэффициент корреляции выборки представляет собой ковариацию двух наборов данных, деленную на произведение их стандартных отклонений.
Корреляционный анализ дает возможность установить ассоциированы ли наборы данных по величине, то есть: большие значения из одного набора данных связаны с большими значениями другого набора (положительная корреляция); или, наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная корреляция); или данные двух диапазонов никак не связаны (корреляция близка к нулю).
Регрессия также является инструментом пакета анализа данных Microsoft Excel.. Линейный регрессионный анализ заключается в подборе графика для набора наблюдений с помощью метода наименьших квадратов. Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или более независимых переменных. Например, на курс биржевых ставок влияют несколько факторов, включая такие, как время совершения сделки и ее цена. Регрессия пропорционально распределяет меру качества по этим двум факторам на основе данных функционирования курса биржевых ставок. Результаты регрессии могут быть использованы для предсказания качеств новых, не совершенных еще биржевых сделок. Например, используя табл.2, которая была составлена на предприятии ЗАО «Чебоксарская керамика», можно с помощью регрессии предсказать цены следующих сделок.
Наблюдение
| Предсказанная цена сделки в рублях | Остатки |
1 | 72,22015 | 27,22985 |
2 | 72,76796 | 26,63204 |
3 | 72,90313 | 26,40687 |
4 | 72,95293 | 26,35707 |
5 | 73,08099 | 25,91901 |
6 | 73,09522 | 25,90478 |
7 | 75,62617 | 22,98383 |
8 | 75,74178 | 23,24822 |
9 | 76,17932 | 22,48068 |
10 | 76,31094 | 22,33906 |
11 | 76,34473 | 22,35527 |
12 | 76,65421 | 22,14579 |
13 | 76,65421 | 22,14579 |
14 | 76,66488 | 21,98512
|
Табл.2. Предсказанная цена сделки в рублях.
4.Характеристика метода корреляционно-регрессионного анализа.
Корреляционно-регрессионный анализ является одним из наиболее распространенных математических методов, используемых в анализе хозяйственной деятельности предприятия. Применение этого метода требует использования программ решения задач на ЭВМ, так как корреляционно-регрессионный анализ требует большого количества трудоемких расчетов и большой подготовительной работы.
Корреляционно-регрессионный анализ применяется в тех случаях, когда между анализируемыми показателями нет строгой зависимости и полного соответствия, т. е. нет функциональной зависимости.
Корреляционный анализ основывается на массовости (не меньше 20 пар наблюдений) данных, так как малое количество наблюдений не позволяет обнаружить закономерность связи.
Благодаря корреляционному анализу можно решить две задачи:
1)Изучается теснота связи между исследуемыми показателями.
2)Количественно измеряется степень влияния анализируемого фактора на исследуемый показатель, т. е. проявляется характер связи.
Теснота связи между двумя показателями измеряется путем определения специального коэффициента корреляции (при прямой зависимости) или корреляционного отношения (при криволинейной зависимости). В процессе корреляционно-регрессионного анализа рассчитывается ряд основных параметров. Их характеристика и оптимальные значения.
Параметр | Характеристика | Оптимальное значение |
1 | 2 | 3 |
Объем выборки | Количество данных по фактору. Применяется для установления тенденций изменения фактора | Не менее чем в 3-5 раз больше количества факторов |
Коэффициент вариации | Уровень отклонения значений факторов от средней анализируемой совокупности | Меньше 33% |
Коэффициент парной корреляции | Характеризует тесноту связи между i-м фактором и функцией. Применяется для отбора факторов. | Больше 0,1 |
Коэффициент частной корреляции | Характеризует тесноту связи между факторами. Применяется для отбора факторов | Чем меньше, тем лучше модель |
Коэффициент множественной корреляции | Характеризует тесноту связи одновременно между всеми факторами и функцией. Применяется для выбора модели | Больше 0,7 |
Коэффициент множественной детерминации | Характеризует степень влияния на функцию включенных в модель факторов. Равен квадрату коэффициента множественной корреляции | Больше 0,5 |
Коэффициент асимметрии | Характеризует степень отклонения фактического наблюдения случайных наблюдений от нормального по центру распределения. Применяется для проверки нормального распределения | Метод наименьших квадратов может применяться при коэффициенте асимметрии меньше 3,0 |
Коэффициент эксцесса | Характеризует плосковершинность распределения случайных наблюдений от нормального по центру распределения. Применяется для проверки нормальности распределения функций | Меньше 3,0 |
Критерий Фишера | Характеризует значимость уравнения регрессии. Применяется для выбора моделей | Должен быть больше табличного значения, установленного для различных размеров матрицы и вероятностей |
Критерий Стьюдента | Характеризует существенность факторов, входящих в модель. Применяется для выбора модели | Больше 2,0 (при вероятности равной 0,95) |
Среднеквадратическая ошибка коэффициента регрессии | Характеризует точность полученных коэффициентов регрессии. Применяется для оценки коэффициентов регрессии | В два и более раза меньше соответствующего коэффициента регрессии |
Ошибка аппроксимации | Характеризует допуск прогноза или степень несоответствия эмпирической зависимости теоретической. Применяется для оценки точности модели | Меньше (точнее) 15% |
Коэффициент эластичности | Показывает, на сколько процентов изменится функция при изменении соответствующего фактора на 1%. Применяется для ранжирования факторов по их значимости | Больше 0, 01 |
Табл.3. Характеристика основных параметров корреляционно – регрессионного анализа.
Регрессионный и корреляционный анализы — это эффективные методы, которые разрешают анализировать значительные объемы информации с целью исследования вероятной взаимосвязи двух или больше переменных.
В регрессионном анализе рассматривается связь между одной переменной, которая называется зависимой переменной, или признаком, и несколькими другими, которые называются независимыми переменными.
Эта связь представляется с помощью математической модели, то есть уравнением, которое связывает зависимую переменную (у) с независимыми (х) с учетом множества соответствующих предположений.
Поскольку цель регрессионного анализа есть выявление влияния переменных Х на значение переменной У, последнюю еще называют откликом, или результативным фактором, а переменные х — факторами, которые влияют на отклик.
Регрессионный анализ используется по двум причинам.
Во-первых, так как описание зависимости между переменными помогает установить наличие возможной причинной связи.
Во-вторых, получение аналитической зависимости между переменными дает возможность предусматривать будущие значения зависимой переменной по значениям независимых переменных.
При анализе социально-экономических процессов регрессия применяется одновременно с корреляцией.
С помощью регрессии определяются аналитические зависимости между переменными, а через корреляционный анализ — сила связи между факторами и откликом.
Именно потому, что основные статистические проблемы регрессионного анализа решаются анализом корреляций, методы регрессионного и корреляционного анализа тесно связанные между собою.
Пример задачи, решаемой с помощью метода корреляции.
Пример. Определить достоверность взаимосвязи между показателями веса и максимального количества сгибания и разгибания рук в упоре лежа у 10 исследуемых с помощью расчета рангового коэффициента корреляции, если данные выборок таковы:
xi, кг ~ 55; 45; 43; 47; 47; 51; 48; 60; 53; 50
yi, кол-во раз ~ 26; 20; 25; 22; 27; 28; 16; 15; 18; 24
Решение:
1. Расчет рангового коэффициента корреляции Спирмена произведем по формуле:
где: dx и dy — ранги показателей х и у;
n — число коррелируемых пар или исследуемых.
2. Данные тестирования занесем в рабочую таблицу и сделаем необходимые расчеты.
xi | dx | yi | dy | ||
55 | 9 | 26 | 9 | 0 | 0 |
45 | 2 | 20 | 4 | -2 | 4 |
43 | 1 | 25 | 7 | -6 | 36 |
47 | 3.5 | 22 | 5 | -1.5 | 2.25 |
47 | 3.5 | 7 | 8 | -4.5 | 20.25 |
51 | 7 | 28 | 10 | -3 | 9 |
48 | 5 | 16 | 2 | 3 | 9 |
60 | 10 | 15 | 1 | 9 | 81 |
53 | 8 | 28 | 3 | 5 | 25 |
50 | 6 | 14 | 6 | 0 | 0 |
|
|
|
| =0 | =186.5 |
Тогда
3. Сравним расчетное значение рангового коэффициента корреляции
(rф = -0,13) с табличным значением для n = 10 при a = 5% .
Анализируя задачу, можно сделать следующие выводы:
1) т.к. rф = -0,13 < 0, то между данными выборок наблюдается прямая отрицательная взаимосвязь, т.е. увеличением показателей веса вызывает снижение максимального количество сгибаний и разгибаний рук в упоре лежа в группе исследуемых;
2) т.к. rф = -0,13 < rst = 0,64 для n = 10 при a = 5%, то с уверенностью b = 95% можно говорить о том, что выявленная зависимость недостоверна.
5.Задачи корреляционно-регрессивного анализа и моделирования.
В соответствии с сущностью корреляционной связи ее изучение имеет две цели:
1) измерение параметров уравнения, выражающего связь средних значений зависимой переменной со значениями независимой переменной (зависимость средних величин результативного признака от значений одного или нескольких факторных признаков);
2) измерение тесноты связи двух (или большего числа) признаков между собой.
Вторая цель специфична для статистических связей, а первая разработана для функциональных связей и является общей. Основным методом решения задачи нахождения параметров уравнения связи является метод наименьших квадратов (МНК), разработанный К. Ф. Гауссом (1777-1855). Он состоит в минимизации суммы квадратов отклонений фактически измеренных значений зависимой переменной у от ее значений, вычисленных по уравнению связи с факторным признаком (многими признаками) х.
Для измерения тесноты связи применяется несколько показателей. При парной связи теснота связи измеряется, прежде всего, корреляционным отношением, которое обозначается греческой буквой п. Квадрат корреляционного отношения - это отношение межгрупповой дисперсии результативного признака, которая выражает влияние различий группировочного факторного признака на среднюю величину результативного признака, к общей дисперсии результативного признака, выражающей влияние на него всех причин и условий. Квадрат корреляционного отношения называется коэффициентом детерминации:
где k — число групп по факторному признаку;
N - число единиц совокупности;
yi - индивидуальные значения результативного признака;
у?j - его средние групповые значения;
у? - его общее среднее значение;
fj - частота в j-й группе.
Строго говоря, метод корреляционно-регрессионного анализа не может объяснить роли факторных признаков в создании результативного признака. Это очень серьезное ограничение метода, о котором не следует забывать.
Наконец, развивающиеся на базе корреляционно-регрессионного анализа многомерные методы (метод главных компонент, факторный анализ) позволяют синтезировать влияние признаков (первичных факторов), выделяя из них непосредственно не учитываемые глубинные факторы (компоненты). Например, изучая корреляцию ряда признаков интенсификации сельскохозяйственного производства, таких, как фондообеспеченность, затраты труда на единицу площади, энергообеспеченность, внесение удобрений на единицу площади, плотность поголовья скота, можно синтезировать общую часть их влияния на уровень продукции с единицы площади или на производительность труда, получив обобщенный фактор «интенсификация производства», непосредственно не измеримый, не отражаемый единым показателем.
Правильное применение и интерпретация результатов корреляционно-регрессионного анализа возможны лишь при понимании всех специфических черт, достоинств и ограничений метода.
Необходимо сказать и о других задачах применения корреляционно-регрессионного метода, имеющих не формально математический, а содержательный характер.
1. Задача выделения важнейших факторов, влияющих на результативный признак (т.е. на вариацию его значений в совокупности). Эта задача решается в основном на базе мер тесноты связи факторов с результативным признаком.
2. Задача оценки хозяйственной деятельности по эффективности использования имеющихся факторов производства. Эта задача решается путем расчета для каждой единицы совокупности тех величин результативного признака, которые были бы получены при средней по совокупности эффективности использования факторов и сравнения их с фактическими результатами производства,
3. Задача прогнозирования возможных значений результативного признака при задаваемых значениях факторных признаков.
4. Задача подготовки данных, необходимых в качестве исходных для решения оптимизационных задач. Например, для нахождения оптимальной структуры производства в районе на перспективу исходная информация должна включать показатели производительности на предприятиях разных отраслей и форм собственности. В свою очередь, эти показатели могут быть получены на основе корреляционно-регрессионной модели либо на основании тренда динамического ряда (а тренд - это тоже уравнение регрессии).
При решении каждой из названных задач нужно учитывать особенности и ограничения корреляционно-регрессионного метода. Всякий раз необходимо специально обосновать возможность причинной интерпретации уравнения как объясняющего связь между вариацией фактора и результата. Трудно обеспечить раздельную оценку влияния каждого из факторов. В этом отношении корреляционные методы глубоко противоречивы. С одной стороны, их идеал - измерение чистого влияния каждого фактора. С другой стороны, такое измерение возможно при отсутствии связи между факторами и случайной вариации признаков. А тогда связь является функциональной, и корреляционные методы анализа излишни. В реальных системах связь всегда имеет статистический характер, и тогда идеал методов корреляции становится недостижимым. Но это не значит, что эти методы не нужны.
Данное противоречие означает попросту недостижимость абсолютной истины в познании реальных связей. Приближенный характер любых результатов корреляционно-регрессионного анализа не является поводом для отрицания их полезности. Всякая научная истина - относительна. Забыть об этом и абсолютизировать параметры регрессионных уравнений, меры корреляции было бы ошибкой, так же как и отказаться от использования этих мер.
Заключение
В ходе анализа данной темы мы пришли к таким главным выводам.
Корреляционный и регрессионный анализ позволяет определить зависимость между факторами, а так же проследить влияние задействованных факторов. Эти показатели имеют широкое применение в обработке статистических данных для достижения наилучших показателей биржевых ставок.
Корреляционно-регрессионный анализ считается одним из главных методов в маркетинге, наряду с оптимизационными расчетами, а также математическим и графическим моделированием трендов (тенденций).
Результаты регрессии могут быть использованы для предсказания качеств новых, не совершенных еще биржевых сделок.
Корреляционно-регрессионный анализ является одним из наиболее распространенных математических методов, используемых в анализе хозяйственной деятельности предприятия.
Регрессионный и корреляционный анализы — это эффективные методы, которые разрешают анализировать значительные объемы информации с целью исследования вероятной взаимосвязи двух или больше переменных.
Необходимо сказать и о таких задачах применения корреляционно-регрессионного метода, имеющих содержательный характер.
1. Задача выделения важнейших факторов, влияющих на результативный признак (т.е. на вариацию его значений в совокупности). Эта задача решается в основном на базе мер тесноты связи факторов с результативным признаком.
2. Задача оценки хозяйственной деятельности по эффективности использования имеющихся факторов производства. Эта задача решается путем расчета для каждой единицы совокупности тех величин результативного признака, которые были бы получены при средней по совокупности эффективности использования факторов и сравнения их с фактическими результатами производства,
3. Задача прогнозирования возможных значений результативного признака при задаваемых значениях факторных признаков.
4. Задача подготовки данных, необходимых в качестве исходных для решения оптимизационных задач. Например, для нахождения оптимальной структуры производства в районе на перспективу исходная информация должна включать показатели производительности на предприятиях разных отраслей и форм собственности. В свою очередь, эти показатели могут быть получены на основе корреляционно-регрессионной модели либо на основании тренда динамического ряда (а тренд - это тоже уравнение регрессии).
Наконец, основные статистические проблемы регрессионного анализа решаются анализом корреляций, и отсюда следует главный вывод моей работы, что методы регрессионного и корреляционного анализа тесно связаны между собою. И что каждый из методов опирается друг на друга.
Библиографический список:
1.Айвазян С.А., Степанов В.С. «Инструменты статистического анализа данных» // «Мир ПК». 2005. №8.
2.Айвазян С.А. «Программное обеспечение персональных ЭВМ по статисти-
ческому анализу данных»/ М.: Наука, 2008.
3.Гужева В.М. «Информационные системы и технологии на предприятиях» К.: КНЕУ, 2001.
4.Журнал "Профиль", № 12, 25 марта 2002 г.
5.Ивантер Э.В., Коросову А.В. «Общая классификация корреляционных связей»., 1992.
6.Иглин С.П. «Корреляционный анализ» /С-пб., 2009.
7.Кленин А.Н., Шевченко К.К. «Математическая статистика для
экономистов-статистиков»/ М., 2000.
8.Ковалев В.В., О.Н. Волкова «Анализ хозяйственной деятельности предприятия»/М.,2009.
9.Крастинь О.П. «Разработка и интерпретация моделей корреляционных связей в экономике». Рига: Зинате, 2005.
10.Красильников В.В. «Статистика объектов нечисловой природы»/ М., 2001.
11.Колемаев В.А., О.В. Староверов, В.Б. Турундаевский «Теория вероятностей и математическая сатистика»/ М., 2004.
12.«Многомерный статистический анализ на ЭBM с использованием пакета Microsoft Excel»/ М., 2007.
13.Одинцов И.Д. «Теория статистики»/ М., 2008.
Набережные Челны, изд-во Камского политехнического института», 2003.
14.Орлов А.И. «Нечисловая статистика»/М.: «МЗ-Пресс», 2004.
15.Пинчук Н.С., Галузинський Г.П., Орленко Н.С. «Информационные системы и технологии в маркетинге». К.: КНЕУ.2009.
16.Ситник В.Ф. «Основы информационных систем: Науч. пособие /Под ред. Ситника» К.: КНЕУ. 2005.
17.«Теория статистики: Учебник. /Под ред. проф. Р.А. Шмойловой»/ М.: Финансы и статистика,2008.
18.Тюрин Ю.Н., Макаров А.А. «Статистический анализ данных на компьютере». М.:ИНФРА-М, 2004.
19.Френкель А.А., Адамова Е.В. «Корреляционно регрессионный анализ в экономических приложениях»/ М., 2007.
20.Ходасевич Г.Б. «Обработка экспериментальных данных на ЭВМ» /М., 2008.
21.Чернова Т.В. «Экономическая статистика. Учебное пособие» Таганрог: Изд-во ТРТУ, 2009.
22.Шишлянникова Л. М. «Применение корреляционного анализа» /М.,2007.
23. http://dic.academic.ru
24. http://www.market-journal.com
25. http://dvo.sut.ru
4
Информация о работе Задачи корреляционно-регрессивного анализа и моделирования