Корреляция

Автор работы: Пользователь скрыл имя, 16 Апреля 2013 в 18:20, реферат

Описание работы

Различные явления, происходящие в процессе сельскохозяйственного производства, находятся в причинно-следственной однофакторной связи, которая может быть функциональной или корреляционной. При функциональной связи каждому значению факторного признака соответствует строго определенное значение результата. Например, связь средней площади питания сельскохозяйственных растений с плотностью их посадки, выручки с количеством проданной продукции при данных ценах и т.п. В отличие от этого при корреляционной связи одному и тому же значению факторного признака могут соответствовать множество различных результатов.

Файлы: 1 файл

Корреляция.docx

— 61.11 Кб (Скачать файл)

Корреляция

     Различные явления, происходящие в процессе сельскохозяйственного производства, находятся в причинно-следственной однофакторной связи, которая может быть функциональной или корреляционной. При функциональной связи каждому значению факторного признака соответствует строго определенное значение результата. Например, связь средней площади питания сельскохозяйственных растений с плотностью их посадки, выручки с количеством проданной продукции при данных ценах и т.п. В отличие от этого при корреляционной связи одному и тому же значению факторного признака могут соответствовать множество различных результатов. Например, связь между уровнем внесения удобрений и урожайностью сельскохозяйственных культур; уровнем кормления, качеством кормов, породностью коров и их молочной продуктивностью; квалификацией работников, обеспеченностью средствами производства и производительностью труда и т.п.

     Статистикой выработаны специальные  приемы установления и измерения такого вида связей, получившие названия метода корреляционного анализа. Они применимы к измерению связей между двумя признаками- парная корреляция или к измерению связей между тремя и большим числом признаков- множественная корреляция.

     Методы корреляции позволяют  решить следующие основные задачи:

1) определить среднее изменение результативного признака под влиянием одного или комплекса факторов (в абсолютном или относительном измерении); 2) охарактеризовать меру зависимости результативного признака и одного из факторов при среднем значении других; 3) определить тесноту связи результативного признака со всем комплексом включенных в анализ факторов или с отдельным фактором при исключении влияния других;

4) статистически  оценить выборочные показатели  корреляционной связи. Каждая из этих задач решается путем расчета определенных показателей.

     Применение метода корреляционного  анализа включает ряд этапов:

     1.Постановка задачи и установление причин связи. Для этого требуется глубокое понимание сущности изучаемых взаимосвязей, так как сам метод не позволяет установить причины возникновения связей между явлениями, его назначение заключается в их количественном измерении. На данном этапе осуществляется общее ознакомление с изучаемым объектом, уточняются задачи исследования, устанавливается теоретическая возможность причинно-следственной связи.

     2.Отграничение объекта исследования и отбора необходимых признаков. При отграничении объекта следует иметь в виду, что корреляционный анализ должен проводится лишь в пределах качественно однократных ( в социальном, экономическом или производственно-техническом отношении) достаточно многочисленных совокупностей. Отбираемые для корреляционной модели факторные и результативные признаки должны быть существенными, первые должны оказывать непосредственное влияние на вторые. Нежелательно включение в одну модель частных и общих факторов, а также нескольких факторных признаков, находящихся в тесной связи друг с другом.

     Серьезную помощь для отбора  показателей могут оказать результативные  и факторные статистические группировки  с соответствующим анализом влияния  факторов на результативный признак.

     3.Установление формы связи и подбор математического уравнения модели связи. Этот вопрос решается на основании теоретического анализа или предшествующим практическим опытом соответствующих исследований. Если форма связи неизвестна, то проводится группировка статистических данных и изучение изменения средних по группам, сопоставление параллельных рядов , построение графиков и таблиц распределения численностей. Уравнения, выражающие статистическую связь, называются уравнениями регрессии или корреляции.

     Связь между результативным и  факторным признаками может носить  линейный или криволинейный (параболический, синусоидальный и т.п.) характер. При линейной парной связи между признаками используется уравнение прямой: =+, где - зависимая переменная, - независимая переменная, - начало отсчета, - коэффициент регрессии, показывающий среднее изменение при изменении на единицу. При этом единицы измерения коэффициента регрессии соответствуют единицам измерения величин .

     В случае линейной взаимосвязи  результативного признака с несколькими факторами используется множественное линейное уравнение:

=++++…+,

где -зависимая переменная; - факторные признаки; -начало отсчета; - коэффициенты регрессии, показывающие степень среднего изменения зависимой переменной при изменении факторного признака на единицу при условии, что остальные факторы, включенные в уравнение, остаются неизменными.

     При нелинейной форме связи подбирается соответствующее уравнение криволинейной зависимости, способное наиболее точно отразить имеющуюся связь. Например, форму связи между возрастом коров и их молочной продуктивностью, характеризующуюся тем, что с изменением возраста вначале продуктивность растет, а затем постепенно снижается, можно отразить уравнение параболы второго порядка = ++, где коэффициент регрессии показывает скорость прироста продуктивности коров, а  характеризует замедление.

     4.Расчет числовых характеристик корреляционной связи. Этот этап заключается в нахождении параметров корреляционного уравнения . Для этого составляется система нормальных уравнений, при этом сумма квадратов отклонений фактических данных от исчисленных по уравнению должна быть минимальной, т.е. )²= min, где - фактическое значение зависимой переменной;  - значение зависимой переменной, исчисленное по сравнению. Этот способ называют методом наименьших квадратов.

     Для получения системы  нормальных уравнений записывается  исходное корреляционное уравнение.  Например, при парной линейной  связи уравнение имеет вид: =+. Затем каждый его член перемножается на коэффициент при первом неизвестном () и перед всеми членами уравнения ставится знак суммы. В результате получается первое из нормальных уравнений:

=n+.

     Для получения второго уравнения  каждый член исходного уравнения  перемножается на коэффициент  при втором неизвестном () и произведения складываются:

=+.

     Руководствуясь этими правилами,  можно составить любую необходимую  систему уравнений.

     Величины , , , и т.д. рассчитывают по фактическим данным, подставляют их в уравнения и решают систему уравнений, находя неизвестные параметры ,,,…. В настоящее время созданы специальные стандартные программы для решения этих задач на ЭВМ.

     Теснота связи при наличии  различных формах зависимости  определяется специальными показателями. При парной линейной зависимости- коэффициентом корреляции (), при множественной линейной корреляции- коэффициентом множественной корреляции (), при парной криволинейной зависимости- индексом корреляции (i) или корреляционным отношением (ŋ). Во всех случаях показатель тесноты связи определяется отношением:

= ,

где

 

=   - дисперсия результативного признака под влиянием одного или нескольких факторных;

=  - общая дисперсия результативного признака под влиянием всех факторов( учтенных и неучтенных).

При соотношении  дисперсий и одинаковом числе  наблюдений формула имеет вид:

= .

На основе формулы =  выведен ряд рабочих формул.

Наиболее  употребительной при парной линейной зависимости является:

= .

При множественной  линейной зависимости, если известны коэффициенты парных связей , , , используют следующую формулу:

= .

Линейный  парный коэффициент корреляции меняется в пределах от -1 до +1, а множественный коэффициент и индекс корреляции рассматривается только как положительная величина и изменяется в пределах от 0 до 1. Квадрат коэффициента корреляции и индекса корреляции называется коэффициентом детерминации и показывает, на сколько процентов результативный признак зависит от одного или нескольких факторных признаков, включенных в анализ.

     При изучении связи по выборочным  данным полученные коэффициенты  регрессии и корреляции должны  быть подвергнуты специальной  оценке соответствия их показателям  генеральной совокупности, так называемой  оценке на достоверность.

     Задача 1. Определение показателей связи при парной линейной зависимости по не сгруппированным данным.

     По данным об урожайности зерновых  культур и качестве  (табл.) необходимо составить и решить корреляционное уравнение, определив параметры уравнения, а также тесноту связи.

Решение

Для определения  формы связи между урожайностью зерновых культур и качеством  почвы построим график (рис.3). На оси  абсцисс нанесем значение независимой  переменной (качество почвы), на оси  ординат- зависимой (урожайность). Расположение точек на поле графика показывает, что связь между признаками линейная, прямо пропорциональная и может быть выражена уравнением прямой линии = , где - урожайность зерновых, ц с 1 га;  -качество почвы, баллы; - параметры уравнения связи, которые следует определить на основе решения системы нормальных уравнений с двумя неизвестными:

 

     Все наблюдаемые расчеты сделаны  в табл. 6.1. Подставив их в уравнения,  получим:

 

 

 

 

 

Таблица. Данные для управления связи и коэффициента корреляции

Номер хозяйства

Урожайность зерновых,

ц с 1 га

Качество почвы,

баллы

                          

Расчетные данные

 

                                                                     

Ожидаемое значение урожайности от качества почвы 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

18,1

21,1

22,9

18,9

18,6

30,5

23,4

27,6

20,9

18,2

18,9

25,9

18,5

24,0

17,4

23,9

23,8

20,4

29,2

23,5

55

50

68

48

87

100

75

88

80

66

58

98

60

100

40

94

94

90

100

92

327,61              3 025             995,5

445,21             2 500           1055,0

524,41             4 624           1557,2

357,21             2 304             907,2

345,96             7 569           1618,2

930,25           10 000           3050,0

547,56             5 625           1755,0

761,76             7 744           2428,8

436,81             6 400           1672,0

331,24             4 356           1201,2

357,21             3 364           1096,2

670,81             9 604           2538,2

342,25             3 600           1110,0

576,00           10 000           2400,0

302,76             1 600             696,0

571,21             8 836           2246,6

566,44             8 836           2237,2

416,16             8 100           1836,0

852,64           10 000           2920,0

552,25             8 464           2162,0

19,05

18,32

20,95

18,03

23,72

25,62

21,97

23,87

22,70

20,66

19,49

25,33

19,78

25,62

16,86

24,74

24,74

24,16

25,62

24,45

Сумма

445,7

1543

10215,75      126 551          35482,3

445,70


 


35


30


25


20                              


15                         


10


5


        10   20   30   40   50   60   70   80   90   100                                                                     

Рис.3. зависимость урожайности  от качества почвы

     Разделим два уравнения  на коэффициенты при , т.е. первое на 20, второе- на 1543:

 

     Вычтем из большего  уравнения меньшее, в данном  случае из второго первое: 0,711=4,87 , откуда = = 0,146. Подставим полученное значение в любое уравнение и определим : 22,285=+77,15 ∙ 0,146, отсюда  = 22,285-11,264= 11,021, или 11,02. Уравнение парной линейной зависимости между урожайностью зерновых культур и качеством почвы примет следующий вид: =11,02+0,146 . Коэффициент регрессии (параметр ), равный 0,146, показывает, что с увеличением балла почвы на единицу урожайность возрастает  на 0,146 ц с 1 га в данных конкретных условиях.

     Определим тесноту  связи между изучаемыми признаками, рассчитав коэффициент корреляции  по формуле:

 = .

     Для определения коэффициента  корреляции надо определить среднее  значение  ,   и , а также средние квадратические отклонения по результативному и факторному признакам. Все исходные и расчетные данные имеются в табл.

= = = 1774,11;

= = = 22,285;   = = = 77,15;

= = = =

= = 3,764;

= = = ==19,376

Подставим полученные данные в формулу  коэффициента корреляции:

== = = 0,752.

Коэффициент парной линейной корреляции можно рассчитать и по другой форме, если известен коэффициент регрессии:

=== 0,752.

     Рассчитанный коэффициент  корреляции показал существенную  зависимость урожайности зерновых  от качества почв. Коэффициент  детерминации (= 0,565) показывает, что на 56,5 % урожайность в данных условиях зависит от качества почвы, а на 44,5 %- от других факторов, которые не были приняты во внимание.

 

 


Информация о работе Корреляция