Непараметрические показатели связи

Автор работы: Пользователь скрыл имя, 30 Августа 2012 в 13:10, реферат

Описание работы

Целью данной работы является изучение тесноты связи. Для этого перед нами стоит ряд задач: для начала необходимо рассмотреть основные понятия анализа взаимосвязей, их цели и задачи. После чего остановимся на каждом конкретном методе измерения связи и выявим их основные направления и способы вычисления.

Содержание работы

Введение…………………………………………………………………………...3
1. Основные понятия корреляционного и регрессионного анализа………..….4
2. Корреляционно-регрессионный метод анализа………………...………….....7
3. Непараметрические показатели связи……………………………………….13
Заключение…………………………………………………………………….…20Список использованной литературы…………………………………………...22

Файлы: 1 файл

измерение тесноты связи.doc

— 183.00 Кб (Скачать файл)

 

Пример.

     На  основе выборочных данных о деятельности 6 предприятий одной из отраслей промышленности оценить тесноту  связи между трудоемкостью продукции  предприятия (X, чел.-час.) и объемом ее производства (Y, млн. руб.).

Расчетная таблица для определения  коэффициента корреляции

№ п/п Объем произведенной  продукции, млн. руб., Y Затраты на 100 изделий, чел.-час, X yx y2 x2
1

2

3

4

5

6

221

1070

1001

606

779

789

96

77

77

89

82

81

21216

82390

77077

53934

63878

63909

48841

1144900

1002000

367236

606841

622520

9216

5929

5929

7921

6724

6561

Сумма 4466 502 362404 3792338 42280
Средняя 744,33 83,67 60400,67 632056,33 7046,67

 

     Используя формулу получаем:

 

     По  формуле  значение коэффициента корреляции составило:

     Таким образом, результат по всем формулам одинаков и свидетельствует о  сильной обратной зависимости между  изучаемыми признаками.

     В случае наличия линейной и нелинейной зависимости между двумя признаками для измерения тесноты связи применяют так называемое корреляционное отношение. Различают эмпирическое и теоретическое корреляционное отношение.

     Эмпирическая (т.е. выборочная) оценка этой характеристики вычисляется по следующим формулам:

     Здесь черта сверху означает операцию среднего арифметического:

, а величина

называется  ковариацией и обозначается как cov (x,y).

     Величину  выборочного коэффициента корреляции следует считать достаточной для статистического обоснованного вывода о наличии корреляционной связи между исследуемыми переменными, если будет выполнено условие:

, где - табличное значение квантили распределения Стьюдента с (n - 2)- мя степенями свободы и уровнем значимости, равным a/2.

     В альтернативном случае неравенства  принимается гипотеза об отсутствии корреляционной связи.

     Доверительный интервал для теоретического (т.е. истинного) коэффициента корреляции r заключен в  пределах: th z1 < r< th z2 ,

Где ,

  - квантиль нормального распределения с уровнем значимости a/2, причем величина находится при заданном по таблицам z-преобразования Фишера (или прямым вычислением).

Пример.

     По  данным n = 39 предприятий получен  коэффициент корреляции =-0,654, характеризующий тесноту связи между себестоимостью продукции (y) и производительностью труда (x). Найти доверительную оценку для r, задавшись 95% - й доверительной вероятностью (или 5% - м уровнем значимости).

     Из  таблиц z-преобразования Фишера (или  прямым вычислением) для  =-0,654 находим z = - 0,7823.

     Тогда получим

,

.

     Далее, по таблицам z-преобразования Фишера, но уже по значениям: функции и находим аргументы и :

=- 0,756, = - 0,420 .

     Таким образом, можно утверждать, что с  доверительной вероятностью P = 95% истинное значение коэффициента корреляции r между  себестоимостью продукции (y) и производительностью труда x будет лежать в интервале от – 0,756 до – 0, 420. 

Непараметрические показатели связи 

     В статистической практике могут встречаться  такие случаи, когда качества факторных  и результативных признаков не могут  быть выражены численно. Поэтому для измерения тесноты зависимости необходимо использовать другие показатели. Для этих целей используются так называемые непараметрические методы.

     Наибольшее  распространение имеют ранговые коэффициенты корреляции, в основу которых положен принцип нумерации значений статистического ряда. При использовании коэффициентов корреляции рангов коррелируются не сами значения показателей х и у, а только номера их мест, которые они занимают в каждом ряду значений. В этом случае номер каждой отдельной единицы будет ее рангом.

     В качестве грубой количественной оценки корреляции используются коэффициенты корреляции рангов Спирмена и Кендалла, меняющиеся от –1 до +1, и чем ближе они по модулю к 1, тем теснее зависимость.

     Ранг  – это порядковый номер единицы совокупности в ранжированном ряду. Ранжировать оба признака необходимо в одном и том же направлении: либо от меньших значений к большим, либо наоборот.

     Идея  использования ранговых коэффициентов  состоит в следующем: если проранжировать совокупность по двум признакам, то полное совпадение рангов означает максимально тесную прямую связь, а полная противоположность рангов - максимально тесную обратную связь.

     Ранговый  коэффициент Спирмена рассчитывается согласно формуле:

,

где - сумма квадратов разностей рангов,

- разность рангов каждой пары  значений x и y,

n - общее число вариант, имеющих оба признака (число наблюдений).

     Ранговый  коэффициент корреляции Кендалла использует несколько другую методику вычислений и определяется согласно формуле:

Здесь – сумма положительных и отрицательных баллов (фактическая сумма рангов), где P – общая сумма числа рангов для каждого значения более высокого порядка (эти баллы учитываются со знаком «плюс»); Q - общая сумма числа рангов следующих для каждого значения , меньших по значению (эти баллы учитываются со знаком «минус»).

     Рассмотрим  методику вычислений обоих ранговых коэффициентов на примере измерения  тесноты связи между объёмом  выпуска продукции (y, млн руб.) и  стоимостью основных производственных фондов (x, млн руб.) по данным 10 предприятий.

     Расчет  необходимых показателей (графы 3 – 8) на основе исходных данных (графы 1 и 2) дается в следующей таблице:

X Y
Подсчет баллов
+ -
1 2 3 4 5 6 7 8
1,5

1,8

2,0

2,2

2,3

2,6

3,0

3,1

3,5

3,8

3,9

4,4

3,8

3,5

4,8

4,3

7,0

6,5

6,1

8,2

1

2

3

4

5

6

7

8

9

10

3

5

2

1

6

4

9

8

7

10

-2

-3

1

3

-1

2

-2

0

2

0

4

9

1

9

1

4

4

0

4

0

7

5

6

6

4

4

1

1

1

-

2

3

1

0

1

0

2

1

0

-

          SD2=36 P = 35 Q = -10

 

     Коэффициент корреляции рангов Спирмена получается равным

. 

     Для расчета коэффициента корреляции рангов Кендэлла находим общую сумму баллов (эти баллы даны в графах 7 и 8): S = P + Q = 35 + (-10) = 25. Тогда ранговый коэффициент Кендалла равен

.

     Следует заметить, что коэффициент Кендалла всегда меньше, чем коэффициента Спирмена, так как .

     Также к непараметрическим методам исследования можно отнести коэффициент ассоциации Кас и коэффициент контингенции Ккон, которые используются, если, например, необходимо исследовать тесноту зависимости между качественными признаками, каждый из которых представлен в виде альтернативных признаков.

     Для определения этих коэффициентов  создается расчетная таблица (таблица  «четырех полей»), где статистическое сказуемое схематически представлено в следующем виде:

Признаки А (да) А (нет) Итого
В (да) a b a + b
В (нет) с d c + d
Итого a + c b + d n

 

     Здесь а, b, c, d - частоты взаимного сочетания (комбинации) двух альтернативных признаков ; n - общая сумма частот.

     Коэффициент ассоциации можно расcчитать по формуле

          Коэффициент контингенции рассчитывается по формуле

 

     Нужно иметь в виду, что для одних  и тех же данных коэффициент контингенции (изменяется от -1 до +1) всегда меньше коэффициента ассоциации.           

     Если  необходимо оценить тесноту связи  между альтернативными признаками, которые могут принимать любое число вариантов значений, применяется коэффициент взаимной сопряженности Пирсона (КП).

     Для исследования такого рода связи первичную  статистическую информацию располагают  в форме таблицы:

Признаки A B C Итого
D m11 m12 m13 ∑m1j
E m21 m22 m23 ∑m2j
F m31 m32 m33 ∑m3j
Итого ∑mj1 ∑mj2 ∑mj3 П

     Здесь mij - частоты взаимного сочетания двух атрибутивных признаков; П - число пар наблюдений.

     Коэффициент взаимной сопряженности Пирсона  определяется по формуле

  

где φ2  - показатель средней квадратической сопряженности:

     Коэффициент взаимной сопряженности изменяется от 0 до 1.

     Наконец, следует упомянуть коэффициент Фехнера, характеризующий элементарную степень тесноты связи, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации. Данный коэффициент определяется по формуле

 

где na - количество совпадений знаков отклонений индивидуальных величин от их средней арифметической; nb - соответственно количество несовпадений.

          Коэффициент Фехнера может изменяться в пределах -1,0   Кф   +1,0.

     Пример.

     По  данным о прибыли и объеме кредитных  вложений 10 коммерческих банков одного из регионов определить с помощью  коэффициента Спирмена зависимость  между этими признаками.

Расчет  коэффициента Спирмена

№ банка Кредитные вложения, млн. руб., X Прибыль, млн.руб., Y Ранги Разность  рангов di = Rx - Ry di2
Rx Ry
1 2 3 8 9 10 11
1

2

3

4

5

6

7

8

9

10

2887

1710

3010

2472

2535

1897

2783

1862

1800

2003

557

605

628

488

418

397

501

589

269

437

9

1

10

6

7

4

8

3

2

5

7

9

10

5

3

2

6

8

1

4

2

-8

0

1

4

2

2

-5

1

1

4

64

0

1

16

4

4

25

1

1

Итого - - - - - 120

Информация о работе Непараметрические показатели связи