Автор работы: Пользователь скрыл имя, 22 Мая 2015 в 22:14, контрольная работа
Вариационным рядом или рядом распределения называют упорядоченное распределение единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака. Итервальный ряд – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака Xi и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей).
Настриг шерсти, кг |
Длина волоса, см | |
Мода |
Мо=4,72+(4,96-4,72)*(8-3)/((8- -3)+(8-5))=4,9 |
Мо=17,3+(19,3-17,3)*(6-2)/((6- -2)+(6-5))=18,9 |
Медиана |
Ме=4,48+(4,72-4,48)*((5+3+ +3+8+5+1)/2-8)/3=4,8 |
Ме=17,3+(19,3-17,3)*((3+ +4+2+6+5+5)/2-9)/6=18,5 |
С помощью функций табличного процессора Excel найдём среднеарифметическую, дисперсию, среднее квадратичное отклонение, коэффициент вариации, ассиметрию и эскцесс.
Показатели |
Настриг шерсти |
Длина волоса |
Мода |
4,9 |
18,9 |
Медиана |
4,8 |
18,5 |
Среднеарифметическая |
4,69 |
17,98 |
Диперсия |
0,15 |
11,34 |
Среднее квадратичное отклонение |
0,39 |
3,37 |
Коэффициент вариации |
0,08 |
0,19 |
Ассиметрия |
-0,25 |
-0,46 |
Эксцесс |
-1,06 |
-0,74 |
Таблица 3.
Вывод: мы нашли средние значения для анализа рядов распределения – среднюю арифметическую, моду и медиану, а также некоторые показатели вариации. Отрицательное значение ассиметрии означает левостороннюю ассиметрию, а значение эксцесса указывает на высокую вариацию.
Дисперсионный анализ.
Цель работы:
Научиться используя данные интервального ряда распределения настрига шерсти с помощью дисперсионного анализа рассчитывать достоверность разницы в настриге шерсти в зависимости от длины волоса шерсти.
При группировке данных по одному признаку и случайному, т.е. независимому формированию групп, общая вариация раскладывается на групповую и общую вариацию:
Формулы для расчета вариации имеют вид:
общая вариация (сумма квадратов отклонений индивидуальных значений признака от общей средней):
где wо - общая вариация, - общая средняя арифметическая, xij - варианты, k - число групп; ni - численность групп; N - численность совокупности;
групповая вариация (сумма квадратов отклонений групповых средних от общей средней):
где wгр - групповая вариация, - групповые средние арифметические;
остаточная вариация (сумма квадратов отклонений индивидуальных значений признака от средней по группам):
где wост - остаточная вариация.
Схема однофакторного дисперсионного анализа.
Источники вариации |
Вариация (сумма квадратов отклонений) |
Степень свободы вариации |
Дисперсия |
Отношение дисперсий | |
фактическое |
табличное | ||||
Групповая |
wгр |
||||
Остаточная |
wост |
1 |
´ | ||
Общая |
wо |
´ |
´ |
Таблица 4.
Дисперсионный анализ данных по настригу шерсти овец в зависимости от длины волоса шерсти можно представить в виде следующей таблицы:
Длина волоса, см |
Настриг шерсти, кг | |||||
1 |
2 |
3 |
4 |
5 |
6 | |
11,3 - 13,3 |
4 |
4,2 |
4,3 |
|||
13,3 - 15,3 |
4,1 |
4,2 |
4,2 |
4,3 |
||
15,3 - 17,3 |
4,8 |
4,9 |
||||
17,3 - 19,3 |
4,4 |
4,5 |
4,7 |
4,8 |
4,9 |
4,9 |
19,3 - 21,3 |
4,5 |
4,8 |
5 |
5,1 |
5,4 |
|
21,3 - 23,3 |
4,8 |
4,9 |
5,1 |
5,2 |
5,2 |
Таблица 5.
Проведя однофакторный дисперсионный анализ данных при помощи сервиса программы Excel, получим следующие результаты:
ИТОГИ |
||||
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
11,3 - 13,3 |
3 |
12,5 |
4,166666667 |
0,023333333 |
13,3 - 15,3 |
4 |
16,8 |
4,2 |
0,006666667 |
15,3 - 17,3 |
2 |
9,7 |
4,85 |
0,005 |
17,3 - 19,3 |
6 |
28,2 |
4,7 |
0,044 |
19,3 - 21,3 |
5 |
24,8 |
4,96 |
0,113 |
21,3 - 23,3 |
5 |
25,2 |
5,04 |
0,033 |
Таблица 6.
Дисперсионный анализ |
||||||
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F крити-ческое |
Между группами |
2,8107333 |
5 |
0,562146667 |
12,19732014 |
2,16353E-05 |
2,740057541 |
Внутри групп |
0,8756667 |
19 |
0,046087719 |
|||
Итого |
3,6864 |
24 |
Таблица 7.
S2 межгр. = 2,81
S2 внутригр. = 0,86
S2 общ. = 3,69
F набл. = 12,2
F кр. = 2,7
Вывод: Дисперсионный анализ данных наглядно показывает распределение овец по группам в зависимости от длины волоса шерсти и значение настрига шерсти внутри каждой из групп. Так, наибольший настриг шерсти – 28,2 кг – был получен от овец с длиной шерсти 17,3 –19,3 см.
Данные таблицы показывают, что фактическое отношение дисперсий больше табличного, следовательно, разница в среднем настриге шерсти по группам с различной длиной волоса шерсти достоверна при уровне значимости 0,05. Длина волоса шерсти оказывает влияние на их настриг шерсти.
Корреляционный анализ данных. Регрессия. Уравнение линии регрессии.
Цель работы:
Научиться с помощью корреляционного анализа определять влияние длины волоса шерсти на настриг шерсти. Научиться строить линейное уравнение регрессии, рассчитывать коэффициент корреляции и оценивать его достоверность с помощью t-критерия Стьюдента и F-критерия Фишера.
При парной корреляции устанавливают зависимость между двумя признаками, один из которых является факторным, другой - результативным. Связь между ними может иметь различный характер. Поэтому важно правильно установить форму связи между признаками и в соответствии с этим подобрать математическое уравнение, выражающее эту связь.
R – коэффициент корреляции устанавливает, есть ли связь между признаками, и насколько она тесная. -1≤R≤1
Если же модуль коэффициента корреляции ~1, то связь близка к линейной.
Корреляционное поле для зависимости настрига шерсти овец от длины волоса шерсти имеет вид:
Рисунок 7.
График показывает, что связь между признаками имеет прямолинейный характер и поэтому может быть выражена уравнением прямой линии:
Регрессионная статистика | |
Множественный R |
0,843685879 |
R-квадрат |
0,711805863 |
Нормированный R-квадрат |
0,699275683 |
Стандартная ошибка |
0,214921509 |
Наблюдения |
25 |
Таблица 8.
Дисперсион-ный анализ |
|||||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
1 |
2,624001134 |
2,624001134 |
56,80731409 |
1,17426E-07 |
Остаток |
23 |
1,062398866 |
0,046191255 |
||
Итого |
24 |
3,6864 |
Таблица 9.
Коэффици-енты |
Стандартная ошибка |
t-статистика |
P-Значение | |
Y-пересечение |
2,922249458 |
0,238186372 |
12,26875171 |
1,41873E-11 |
Переменная X 1 |
0,098184527 |
0,013026895 |
7,537062697 |
1,17426E-07 |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |
Y-пересечение |
2,42952341 |
3,414975506 |
2,42952341 |
3,414975506 |
Переменная X 1 |
0,071236341 |
0,125132714 |
0,071236341 |
0,125132714 |
Таблица 10.
Вывод: связь между признаками тесна и близка к линейной.
R2 (коэффициент детерминации) = 0,71 = 71%
Вывод: вариация настрига шерсти обусловлена на 71% влиянием длины волоса шерсти. Остальные 29% вариации настрига обусловлены неучтенными факторами.
Для того, чтобы составить уравнение регрессии, необходимо найти параметр В (Y-пересечение) и ρy/x.
Y-пересечение = 0,10
Длина волоса шерсти (х) см = 2,92
Тогда уравнение регрессии будет иметь вид: y=2,92+0,10x
Вывод: при увеличении длины волоса шерсти на 1 см настриг шерсти в среднем увеличивается на 100 г.
Описательная статистика
Цель работы: Научиться рассчитывать основные статистические показатели, характеризующие выборочные показатели.
Для расчета основных статистических показателей, характеризующих выборочную совокупность, в табличном процессоре Microsoft Excel используется инструмент Описательная статистика надстройки Анализ данных. Данный инструмент позволяет рассчитать следующие показатели, характеристика которых приведена в предыдущих темах: