Статистический анализ вариационных рядов распределения (на примере настрига шерсти овец и длины волоса шерсти)

Автор работы: Пользователь скрыл имя, 22 Мая 2015 в 22:14, контрольная работа

Описание работы

Вариационным рядом или рядом распределения называют упорядоченное распределение единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака. Итервальный ряд – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака Xi и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей).

Файлы: 1 файл

контрольная.doc

— 346.00 Кб (Скачать файл)

 

 

Настриг шерсти, кг

Длина волоса, см

Мода

Мо=4,72+(4,96-4,72)*(8-3)/((8-

-3)+(8-5))=4,9

Мо=17,3+(19,3-17,3)*(6-2)/((6-

-2)+(6-5))=18,9

Медиана

Ме=4,48+(4,72-4,48)*((5+3+ +3+8+5+1)/2-8)/3=4,8

Ме=17,3+(19,3-17,3)*((3+

+4+2+6+5+5)/2-9)/6=18,5


 

С помощью функций табличного процессора Excel найдём среднеарифметическую, дисперсию, среднее квадратичное отклонение, коэффициент вариации, ассиметрию и эскцесс.

 

Показатели

Настриг шерсти

Длина волоса

Мода

4,9

18,9

Медиана

4,8

18,5

Среднеарифметическая

4,69

17,98

Диперсия

0,15

11,34

Среднее квадратичное отклонение

0,39

3,37

Коэффициент вариации

0,08

0,19

Ассиметрия

-0,25

-0,46

Эксцесс

-1,06

-0,74


Таблица 3.

 

Вывод: мы нашли средние значения для анализа рядов распределения – среднюю арифметическую, моду и медиану, а также некоторые показатели вариации. Отрицательное значение ассиметрии означает левостороннюю ассиметрию, а значение эксцесса указывает на высокую вариацию.

 

Дисперсионный анализ.

 

Цель работы:

Научиться используя данные интервального ряда распределения настрига шерсти с помощью дисперсионного анализа рассчитывать достоверность разницы в настриге шерсти в зависимости от длины волоса шерсти.

 

При группировке данных по одному признаку и случайному, т.е. независимому формированию групп, общая вариация раскладывается на групповую и общую вариацию:

Формулы для расчета вариации имеют вид:

общая вариация (сумма квадратов отклонений индивидуальных значений признака от общей средней):

,

где wо - общая вариация, - общая средняя арифметическая, xij - варианты, k - число групп; ni - численность групп; N - численность совокупности;

групповая вариация (сумма квадратов   отклонений групповых средних от общей средней):

,

где wгр - групповая вариация, - групповые средние арифметические;

остаточная вариация (сумма квадратов отклонений индивидуальных значений признака от средней по группам):

,

где wост - остаточная вариация.

 

 

Схема однофакторного дисперсионного анализа.

 

Источники вариации

Вариация (сумма квадратов отклонений)

Степень свободы вариации

Дисперсия

Отношение дисперсий

фактическое

табличное

Групповая

wгр

Остаточная

wост

1

´

Общая

´

´


Таблица 4.

 

Дисперсионный анализ данных по настригу шерсти овец в зависимости от длины волоса шерсти можно представить в виде следующей таблицы:

 

Длина волоса, см

Настриг шерсти, кг

1

2

3

4

5

6

11,3 - 13,3

4

4,2

4,3

     

13,3 - 15,3

4,1

4,2

4,2

4,3

   

15,3 - 17,3

4,8

4,9

       

17,3 - 19,3

4,4

4,5

4,7

4,8

4,9

4,9

19,3 - 21,3

4,5

4,8

5

5,1

5,4

 

21,3 - 23,3

4,8

4,9

5,1

5,2

5,2

 

Таблица 5.

 

Проведя однофакторный дисперсионный анализ данных при помощи сервиса программы Excel, получим следующие результаты:

 

ИТОГИ

       

Группы

Счет

Сумма

Среднее

Дисперсия

11,3 - 13,3

3

12,5

4,166666667

0,023333333

13,3 - 15,3

4

16,8

4,2

0,006666667

15,3 - 17,3

2

9,7

4,85

0,005

17,3 - 19,3

6

28,2

4,7

0,044

19,3 - 21,3

5

24,8

4,96

0,113

21,3 - 23,3

5

25,2

5,04

0,033


Таблица 6.

 

 

 

 

Дисперсионный анализ

           

Источник вариации

SS

df

MS

F

P-Значение

F крити-ческое

Между группами

2,8107333

5

0,562146667

12,19732014

2,16353E-05

2,740057541

Внутри групп

0,8756667

19

0,046087719

     
             

Итого

3,6864

24

       

Таблица 7.

 

S2 межгр. = 2,81

S2 внутригр. = 0,86

S2 общ. = 3,69

F набл. = 12,2

F кр. = 2,7

 

Вывод: Дисперсионный анализ данных наглядно показывает распределение овец по группам в зависимости от длины волоса шерсти и значение настрига шерсти внутри каждой из групп. Так, наибольший настриг шерсти – 28,2 кг – был получен от овец с длиной шерсти 17,3 –19,3 см.

Данные таблицы показывают, что фактическое отношение дисперсий больше табличного, следовательно, разница в среднем настриге шерсти по группам с различной длиной волоса шерсти достоверна при уровне значимости 0,05. Длина волоса шерсти оказывает влияние на их настриг шерсти.

 

Корреляционный анализ данных. Регрессия. Уравнение линии регрессии.

 

Цель работы:

Научиться с помощью корреляционного анализа определять влияние длины волоса шерсти на настриг шерсти. Научиться строить линейное уравнение регрессии, рассчитывать коэффициент корреляции и оценивать его достоверность с помощью t-критерия Стьюдента и F-критерия Фишера.

 

При парной корреляции устанавливают зависимость между двумя признаками, один из которых является факторным, другой - результативным. Связь между ними может иметь различный характер. Поэтому важно правильно установить форму связи между признаками и в соответствии с этим подобрать математическое уравнение, выражающее эту связь.

R – коэффициент корреляции устанавливает, есть ли связь между признаками, и насколько она тесная.  -1≤R≤1

Если же модуль коэффициента корреляции ~1, то связь близка к линейной.

Корреляционное поле для зависимости настрига шерсти овец от длины волоса шерсти имеет вид:

Рисунок 7.

 

График показывает, что связь между признаками имеет прямолинейный характер и поэтому может быть выражена уравнением прямой линии:

 

 

 

Регрессионная статистика

Множественный R

0,843685879

R-квадрат

0,711805863

Нормированный R-квадрат

0,699275683

Стандартная ошибка

0,214921509

Наблюдения

25


Таблица 8.

 

Дисперсион-ный анализ

         
 

df

SS

MS

F

Значимость F

Регрессия

1

2,624001134

2,624001134

56,80731409

1,17426E-07

Остаток

23

1,062398866

0,046191255

   

Итого

24

3,6864

     

Таблица 9.

 

 

Коэффици-енты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

2,922249458

0,238186372

12,26875171

1,41873E-11

Переменная X 1

0,098184527

0,013026895

7,537062697

1,17426E-07

 

Нижние 95%

Верхние

95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

2,42952341

3,414975506

2,42952341

3,414975506

Переменная X 1

0,071236341

0,125132714

0,071236341

0,125132714


Таблица 10.

 

Вывод: связь между признаками тесна и близка к линейной.

R2 (коэффициент детерминации) = 0,71 = 71%

 

Вывод: вариация настрига шерсти обусловлена на 71% влиянием длины волоса шерсти. Остальные 29% вариации настрига обусловлены неучтенными факторами.

 

Для того, чтобы составить уравнение регрессии, необходимо найти параметр В (Y-пересечение) и ρy/x.

Y-пересечение = 0,10

Длина волоса шерсти  (х) см = 2,92

Тогда уравнение регрессии будет иметь вид: y=2,92+0,10x

 

Вывод: при увеличении длины волоса шерсти на 1 см настриг шерсти в среднем увеличивается на 100 г.

 

Описательная статистика

 

Цель работы: Научиться рассчитывать основные статистические показатели, характеризующие выборочные показатели.

 

Для расчета основных статистических показателей, характеризующих выборочную совокупность, в табличном процессоре Microsoft Excel используется инструмент Описательная статистика надстройки Анализ данных. Данный инструмент позволяет рассчитать следующие показатели, характеристика которых приведена в предыдущих темах:

  • средняя арифметическая простая
  • средняя ошибка выборки
  • медиана (Me)
  • мода (Mo)
  • выборочное среднее квадратическое отклонение
  • выборочная дисперсия с учетом поправки
  • эксцесс
  • асимметрия
  • размах вариации
  • предельная ошибка выборки

Информация о работе Статистический анализ вариационных рядов распределения (на примере настрига шерсти овец и длины волоса шерсти)