Автор работы: Пользователь скрыл имя, 26 Октября 2010 в 21:05, Не определен
Контрольная работа
2. Функция MS Excel «КОРРЕЛ»
Статистические распределения характеризуются наличием более или менее значительной вариации в величине признака у отдельных единиц совокупности. Естественно возникает вопрос о том, какие же причины формируют уровень признака в данной совокупности и каков конкретный вклад каждой из них. Изучение зависимости вариации признака от окружающих условий и составляет содержание теории корреляции. (Основоположниками теории корреляции считаются английские биометрики Ф. Гальтон (1822—1911) и К. Пирсон (1857—1936). Термин «корреляция» был заимствован из естествознания и обозначает соотношение, соответствие. Представление о корреляции как об отношении взаимозависимости между случайными переменными величинами лежит в основе математико-статистической теории корреляции).
Изучение действительности показывает, что каждое общественное явление находится в тесной связи и взаимодействии с другими явлениями. Так, например, уровень производительности труда работников предприятия будет зависеть от совершенства применяемого оборудования, степени совершенства технологии, организации производства труда и управления и других самых различных факторов.
При изучении конкретных зависимостей одни признаки выступают в качестве факторов, обусловливающих изменение других признаков. Признаки этой первой группы в дальнейшем будем называть признаками-факторами (факторными признаками); а признаки, которые являются результатом влияния этих факторов, будем называть результативными. Например, при изучении зависимости между производительностью труда рабочих и энерговооруженностью их труда уровень производительности труда является результативным признаком, а энерговооруженность труда рабочих— факторным признаком.
Рассматривая зависимости между признаками, необходимо выделить прежде всего две категории зависимостей: 1) зависимости функциональные и 2) зависимости корреляционные.
Функциональные связи характеризуются полным соответствием между изменением причины и изменением результативной величины, и каждому значению признака-фактора соответствует вполне определенное значение результативного признака,
В корреляционных связях между изменением факторного и результативного признака нет полного соответствия, влияние отдельных факторов проявляется лишь в среднем при массовом наблюдении фактов, поскольку каждому значению факторного признака может соответствовать распределение значений результативного признака. В простейшем случае применения корреляционной зависимости величины результативного признака рассматривается как следствие изменения только одного фактора (например, энерговооруженность труда рассматривается как причина роста производительности труда). Однако выделенный в данном примере в качестве основного признак-фактор не является единственной причиной изменения результативного признака, а наряду с ним на величину результативного признака влияет множество других причин. Как уже указывалось, на формирование уровня производительности труда на предприятии более или менее существенное влияние оказывают факторы, характеризующие степень совершенства применяемой техники и технологии, уровень механизации и автоматизации труда, специализации производства, состав работающих, текучесть кадров и т. п. Кроме того, сам признак-фактор в свою очередь зависимая величина. С другой стороны, в сложном взаимодействии находится результат — в более общем виде он выступает как фактор изменения других явлений. Отсюда результаты корреляционного анализа имеют значение в данной связи, а интерпретация этих результатов в более общем виде требует построения системы корреляционных связей.
Сравнивая между собой функциональные и корреляционные зависимости, следует принять во внимание, что при наличии функциональной зависимости между признаками можно, зная величину факторного признака, точно определить величину результативного признака. При наличии же корреляционной зависимости устанавливается тенденция изменения результативного признака при изменении величины факторного признака. В отличие от жесткости однозначно функциональной связи корреляционные связи характеризуются множеством причин и следствий и устанавливаются лишь в их тенденции.
При исследовании корреляционных зависимостей между признаками решению подлежит широкий круг вопросов, к которым следует отнести; 1) предварительный анализ свойств моделируемой совокупности единиц; 2) установление факта наличия связи, определение ее направления и формы; 3) измерение степени тесноты связи между признаками; 4) построение регрессионной модели, т. е. нахождение аналитического выражения связи; 5) оценка адекватности модели, ее экономическая интерпретация и практическое использование.
Чтобы результаты корреляционного анализа нашли практическое применение и дали желаемый результат, должны выполняться определенные требования в отношении отбора объекта исследования и признаков-факторов. Одним из важнейших условий правильного применения методов корреляционного анализа является требование однородности тех единиц, которые подвергаются изучению методами корреляционного анализа.
Определенные требования существуют и в отношении факторов, вводимых в исследование. Все множество факторов, оказывающих влияние на величину результативного показателя, в действительности не может быть введено в рассмотрение, да практически в этом и нет необходимости, так как их роль и значение в формировании величины функции могут иметь существенные различия. Поэтому при ограничении числа факторов, включаемых в рассмотрение наряду с качественным анализом целесообразно использовать и определенные количественные оценки, позволяющие конкретно охарактеризовать степень влияния факторов на результативный признак (к оценкам можно отнести парный коэффициент корреляции, ранговые коэффициенты при экспертной оценке специалистами влияния факторов и др.).
Все основные положения теории корреляции разрабатывались применительно к предположению о нормальном характере распределения исследуемых признаков. В этой связи целесообразным является изучение формы распределения, дающее возможность в известной мере обосновать правомерность применения методов корреляционного анализа.
Проверку нормальности распределения зависимой переменной можно проводить при каждом фиксированном значении факторного признака или внутри каждого отдельного интервала группирования, на которые разбит диапазон изменения факторного признака, пользуясь различными критериями согласия. Для проверки исходной предпосылки нормальности распределения необходимо в каждой группе иметь достаточно большое количество наблюдений, что в практических исследованиях встречается довольно редко.
Следует отметить, что на практике часто сталкиваются с теми или иными отклонениями от исходных предпосылок. Однако это не означает, что мы должны отказываться от применения методов корреляционно-регрессионного анализа.
И наконец, при построении корреляционных моделей факторы должны иметь количественное выражение, иначе составить модель корреляционной зависимости не представляется возможным.
Для ответа на вопрос о наличии или отсутствии корреляционной связи статистика использует ряд специфических методов: так называемые «элементарные» приемы (параллельное сопоставление рядов значений результативного и факторного признаков, построение групповой, корреляционной и комбинационной таблиц), а также дисперсионный анализ. Простейшим приемом обнаружения связи является сопоставление двух параллельных рядов — ряда значений факторного признака и соответствующих ему значений результативного признака. Значения факторного признака располагают в возрастающем порядке и затем прослеживают направление изменения величины результативного. Результативный признак (функцию) в дальнейшем будем обозначать через у, а факторный признак—через х.
Корреляционная таблица позволяет сжато, компактно изложить материал, поэтому все последующие расчеты (показателей тесноты связи и параметров уравнения) можно вести по корреляционной таблице.
Другим возможным приемом обнаружения связи является построение групповой таблицы. Все наблюдения разбиваются на группы в зависимости от величины признака-фактора, и по каждой группе вычисляются средние значения результативного признака.
Корреляционная зависимость отчетливее обнаруживается только при рассмотрении средних значений результативного признака, соответствующих определенным значениям факторного признака, так как при достаточно большом числе наблюдений в каждой группе влияние прочих случайных факторов при расчете групповой средней будет взаимопогашаться, и яснее выступит зависимость результативного признака от фактора, положенного в основу группировки. (Иными словами, предполагается, что все прочие причины, если они носят случайный характер, при определении средней по группам взаимопогашаются, т. е. дают в каждой группе один и тот же результат. Следовательно, различия в величине средних будут связаны только с различиями в величине данного факторного признака. Если бы связи между факторным и результативным признаком не было, то все групповые средние были бы приблизительно одинаковы по величине. Оценка существенности расхождения групповых средних лежит в основе использования метода дисперсионного анализа для выявления наличия и оценки существенности связи. Для предварительного выявления наличия связи и раскрытия ее характера, а в известной мере и для выбора формы связи применяют графический метод. Используя данные об индивидуальных значениях признака-фактора и соответствующих ему значениях результативного признака, можно построить в прямоугольных осях точечный график, который называют поле корреляции.
Показатели тесноты связи дают возможность охарактеризовать степень зависимости вариации результативного признака от вариации признака-фактора. В известной мере они дополняют и развивают уже отмеченные приемы обнаружения связи.
Зная показатели тесноты корреляционной связи, мы можем решать следующие группы вопросов:
ответить на вопрос о необходимости изучения данной связи между признаками и целесообразности ее практического применения;
сопоставляя показатели тесноты связи для различных ситуаций, можно судить о степени различий в ее проявлении для конкретных условий;
и наконец, сопоставляя показатели тесноты связи результативного признака с различными факторами, можно выявить те факторы, которые в данных конкретных условиях являются решающими и, главным образом, воздействуют на формирование величины результативного признака.
К
простейшим показателям степени
тесноты связи относят
Если обозначить па — число совпадений знаков отклонений индивидуальных величин от средней, пb — число несовпадений знаков отклонений, то коэффициент Г. Фехнера можно записать таким образом:
Коэффициент
Фехнера может принимать
Линейный коэффициент корреляции. Более совершенным- показателем степени тесноты связи является линейный коэффициент корреляции г1.
При расчете этого показателя учитываются не только знаки отклонений индивидуальных значений признака от средней, но и сами величины таких отклонений, т. е. соответственно для факторного и результативного признаков величины. Однако непосредственно сопоставить между собой полученные абсолютные величины нельзя, так как сами признаки могут быть выражены в разных единицах (например, тарифный разряд рабочего и уровень средней выработки в рублях), а при наличии одних и тех же единиц измерения средние могут быть различны по величине. В этой связи сравнению могут подлежать отклонения, выраженные в относительных величинах, т. е. в долях среднего квадратического отклонения (их называют нормированными отклонениями).
Вычисление
коэффициента корреляции по формуле (8.5)
является трудоемкой операцией. Выполнив
несложные преобразования, можно получить
следующую формулу для расчета линейного
коэффициента корреляции
При пользовании этой формулой отпадает необходимость вычислять отклонения индивидуальных значений признаков от средней величины.
Линейный
коэффициент корреляции может принимать
любые значения в пределах от —1
до +1. Чем ближе коэффициент
Эмпирическое корреляционное отношение. Коэффициент корреляции достаточно точно оценивает степень тесноты связи лишь в случае наличия линейной зависимости между признаками. При наличии же криволинейной зависимости линейный коэффициент корреляции недооценивает степень тесноты связи и даже может быть равен 0, а потому в таких случаях рекомендуется использовать в качестве показателя степени тесноты связи эмпирическое корреляционное отношение ŋ2.
Коэффициенты корреляции рангов. Применение линейного коэффициента корреляции для оценки степени тесноты связи между признаками особенно в той части, которая связана с оценкой его существенности, является обоснованным лишь в условиях нормального или близкого к нормальному распределения признаков в изучаемой совокупности. Кроме того, как видно из приводимых выше формул, для определения величины линейного коэффициента корреляции необходимо знать численные значения факторного и результативного признаков. В некоторых же случаях мы можем встретиться с такими качествами, которые не поддаются выражению числом единиц.
Эти обстоятельства заставляют прибегать к использованию так называемых «непараметрических» методов, позволяющих измерить интенсивность связи как между количественными признаками, форма распределения которых отличается от нормальной, так и между качественными признаками. В основу непараметрических методов положен принцип нумерации вариант статистического ряда. Каждой единице совокупности присваивается порядковый номер в ряду, который будет упорядочен по уровню признака. Таким образом, ряд значений признака ранжируется, а номер каждой отдельной единицы будет ее рангом.
Можно получить предварительное представление о наличии или отсутствии связи между признаками, если сопоставить последовательность взаимного расположения рангов факторного и результативного признаков. Для этого ранги индивидуальных значений факторного признака располагают в порядке возрастания, и если ранги результативного признака обнаруживают тенденцию к увеличению, можно предполагать наличие прямой связи; если же с увеличением величины рангов факторного признака величины рангов результативного признака уменьшаются, то это свидетельствует о возможном наличии между изучаемыми признаками обратной связи..
Информация о работе Сглаживание временных рядов с помощью скользящей средней