Автор работы: Пользователь скрыл имя, 05 Апреля 2010 в 13:30, Не определен
В качестве точечных оценок числовых характеристик изучаемой случайной величины используются:
для математического ожидания = (выборочная средняя), для дисперсии
s2 = (исправленная выборочная), где n – объём выборки, ni – частота значения xi .
Таким образом, в статистических расчетах используют приближенные равенства
MX » , DX » s2 .
Вариант
13 – нормальное (или
гауссовское распределение)
4.Построение
графика теоретической
плотности распределения.
Чтобы выписать плотность
MX = а ,
DX = σ2
Поскольку значения
По исходным данным была
_
x = а, 15,9 = а, а=15,9
s2= σ2 53,78 = σ2 σ=7,33
Следовательно,
плотность предполагаемого
F(x)= [1/(7,33*√2π)]*e[-(x-15,9)2
/ 2*(7,33)2)]=0.054*e^(0,009/((
Теперь необходимо вычислить значения f(xi) плотности f (x) при x=xi (в серединах интервалов) Для этого воспользуемся следующей схемой:
значения фунцкии
при u=ui находятся,
например, с помощью таблицы, имеющейся
в любом учебнике или задачнике по теории
вероятностей и математической статистике.
=15,9; s = 7,33
xi |
ui = xi- x / s | φ(ui) | |
1,5
4,5 7,5 10,5 13,5 16,5 19,5 22,5 25,5 28,5 31,5 |
-1,96
-1,56 -1.15 -0,74 -0.33 0.08 0.49 0,90 1.31 1,72 2.13 |
0,0584
0,1182 0,2059 0,3034 0,3778 0,3977 0,3538 0,2661 0,1691 0,0909 0,0413 |
0,008
0,016 0,028 0,041 0,052 0,054 0,048 0,036 0,023 0,012 0,006 |
Далее, на одном чертеже строим гистограмму и график теоретической плотности распределения: гистограмма была построена ранее, а для получения графика плотности наносим точки с координатами (xi ; f(xi)) и соединяем их плавной кривой.
5.Проверка гипотезы о распределении с помощью критерия согласия Пирсона.
Ранее
была выдвинута гипотеза о
законе распределения
Для выбора первого или
Существуют различные критерии согласия: К. Пирсона, А.Н. Колмогорова, Н.В. Смирнова, В.И. Романовского и другие. Мы рассмотрим лишь один из них – критерий Пирсона, называемый также критерием c2 («хи - квадрат»). (К. Пирсон (1857 - 1936) – английский математик, биолог, философ – позитивист.)
Критерий Пирсона выгодно
Правило проверки
Группировка
исходных данных.
Применяется критерий Пирсона к сгруппированным данным. Предположим, что произведено n независимых опытов, в каждом из которых изучаемая случайная величина приняла определенное значение. Предположим, что вся числовая ось разбита на несколько непересекающихся промежутков (интервалов и полуинтервалов). Обозначим через nI количество результатов измерений (значений случайной величины), попавших в i-й промежуток. Очевидно, что ånI = n.
Отметим, что критерий c2 будет давать удовлетворительный для практических приложений результат, если:
Пусть концами построенного
(- ¥ º z0; z1) , [ z1; z2) , [ z2; z3) , … , [ zi – 1; zi º + ¥).
После объединения соответствующих промежутков
(последних двух) и замены самой левой
границы разбиения на - ¥, а самой правой на
+ ¥
(поскольку на промежутки должна разбиваться
вся числовая ось, а не только диапазон
полученных в результате опыта значений),
мы приходим к следующим интервальным
распределениям, пригодным для непосредственного
применения критерия Пирсона:
zi –1; zi | - ¥; 6 | 6;9 | 9;12 | 12;15 | 15;18 | 18;21 |
ni | 10 | 9 | 11 | 14 | 18 | 13 |
21;24 | 24;27 | 27;30 | 30;+∞ | |
11 | 7 | 4 | 3 |
Критерий Пирсона основан на сравнении эмпирических (опытных) частот с теоретическими. Эмпирические частоты nI определяются по фактическим результатам наблюдений. Теоретические частоты, обозначаемые далее , находятся с помощью равенства
где n – количество испытаний, а pi º R (zi –1 < x < zi) - теоретическая вероятность попадания значений случайной величины в i-й промежуток (1 £ i £ 1).Теоретические вероятности вычисляются в условиях выдвинутой гипотезы о законе распределения изучаемой случайной величины.
Процедура
отыскания теоретических
i | Концы промежутков | Аргументы фунцкции Ф0 | Значения функции Ф0 | Pi= Ф0(ui)- Ф0(ui-1) | ν1’=npi | |||
zi -1 | zi | Ui-1=
(zi-1-x)/s |
Ui=
(zi-x)/s |
Ф0(ui-1) | Ф0(ui) | |||
1
2 3 4 5 6 7 8 9 10 |
-∞
6 9 12 15 18 21 24 27 30 |
6
9 12 15 18 21 24 27 30 +∞ |
-∞
-1,35 -0,94 -0,53 -0,12 0,29 0,70 1,11 1,51 1,92 |
-1,35
-0,94 -0,53 -0,12 0,29 0,70 1,11 1,51 1,92 +∞ |
-0,5000
-0,4115 -0,3264 -0,2019 -0,0478 0,1141 0,2580 0,3665 0,4345 0,4726 |
-0,4115
-0,3264 -0,2019 -0,0478 0,1141 0,2580 0,3665 0,4345 0,4726 0,5000 |
0,0885
0,0851 0,1245 0,1541 0,1619 0,1439 0,1085 0,0680 0,0381 0,0274 |
8,85
8,51 12,45 15,41 16,19 14,39 10,85 6,80 3,81 2,74 |
Для того чтобы принять или
отвергнуть гипотезу о законе
распределения изучаемой
В критерии Пирсона в качестве такой меры
расхождения используется величина
называемая
статистикой «хи - квадрат»
или статистикой Пирсона (вообще,
статистикой называют любую функцию от
результатов наблюдений). Ясно, что всегда c2 ³0,
причем c2
= 0, тогда и только тогда, когда
при каждом i , т.е. когда все соответствующие
эмпирические и теоретические частоты
совпадают. Во всех остальных случаях c2 ¹ 0;
при этом значение c2 тем больше,
чем больше различаются эмпирические
и теоретические частоты.
Прежде чем рассказать о
i | ni | ||
1
2 3 4 5 6 7 8 9 10 |
10
9 11 14 18 13 11 7 4 3 |
8,85
8,51 12,45 15,41 16,19 14,39 10,85 6,8 3,81 2,74 |
0,15
0,03 0,17 0,13 0,20 0,13 0,00 0,01 0,01 0,02 |
5.4. Распределение
статистики c2.
Случайная величина имеет c2
– распределение с r
степенями свободы (r = 1; 2; 3; …), если ее
плотность имеет вид
где cr – которая положительная постоянная ( cr определяется из равенства ). Случайная величина, имеющая распределение c2 с r степенями свободы, будет обозначаться .
Для дальнейшего изложения
Вернемся теперь к статистике . Отметим, что она является случайной величиной, поскольку зависит от результатов наблюдений и, следовательно, в различных сериях опытов принимает различные, заранее не известные значения. Понятно, кроме того, закон распределения статистики зависит: 1) от действительного (но неизвестного нам) закона распределения случайной величины, измерения которой осуществляются (им определяются эмпирические частоты ) ; 2) от количества произведенных наблюдений (от числа n) и от способа разбиения числовой оси на промежутки (в частности, от числа i ); 3) от теоретического (выдвинутого в качестве гипотезы) закона распределения изучаемой случайной величины (им определяются теоретические вероятности pi и теоретические частоты = n × pi )
Если выдвинутая гипотеза
Если в качестве
где - количество параметров предполагаемого (теоретического) распределения, которые заменены вычисленными по опытным данным оценками.
Т.е. в данном варианте после группировки исходных данных получаем количество промежутков разбиения i = 10, = 2, т.к. количество параметров предполагаемого (теоретического) распределения, которые заменены вычисленными по опытным данным оценками, = 2 – это а и s для нормального распределения.
Следовательно
R=i-Nпар-1=10-2-1=7
Ранее отмечалось (и этот факт очевиден), что статистика принимает только не отрицательные значения (всегда c2 ³0), причем в нуль она обращается в одном – единственном случае – при совпадении всех соответствующих эмпирических и теоретических частот (т.е. при для каждого i).
Если выдвинутая гипотеза о
законе распределения
Поэтому хотелось бы найти
тот рубеж – называемый критиче
гипотезы
0
Как же найти критическое
Если выдвинутая гипотеза о законе распределения изучаемой случайной величины верна, то вероятность попадания значений статистики в критическую область должна быть мала, так что событие { } должно быть практически неосуществимым в единичном испытании. Эта вероятность, обозначим ее через :
называется уровнем значимости.
Чтобы определить критическое значение , поступим следующим образом. Зададим какое – либо малое значение уровня значимости (как правило = 0,05 или = 0,01) и найдем как уровень уравнения
с неизвестной x. Поскольку распределение статистики близко при к - распределению с r степенями свободы, то
и приближенное значение можно найти из уравнения
Геометрические соображения показывают, что последнее уравнение имеет единственное решение: его корень – это такое число x > 0, при котором площадь под графиком функции (плотности - распределения) над участком равна. На практике решение последнего уравнения находят с помощью специальных таблиц, имеющихся в любом руководстве по математической статистике; эти таблицы позволяют по двум входным параметрам – уровню значимости и числу степеней свободы r определить критическое значение . (Находимое таким образом критическое значение зависит, конечно, от и r,что при необходимости отражают и в обозначениях: ).
Зададим уровень значимости
Подводя итоги, сформулируем правило проверки гипотезы о законе распределения случайной величины с помощью - критерия Пирсона:
так, чтобы количество измерений в каждом из них (называемое эмпирической
частотой
) оказалось
не менее пяти (т.е.
³ 5 при каждом i).
если наблюдаемое значение
если наблюдаемое значение
Правило проверки выдвинутой
гипотезы о законе
Название величины | Обозначение и числовое значение величины |
Уровень значимости (задан в условии) | |
Количество промежутков разбиения | l =10 |
Число степеней свободы | r=7 |
Критическое значение (находится по таблице) | |
Наблюдаемое значение критерия | c2набл. = 0,85 |
ВЫВОД | Гипотеза
не принимается для
данного 9 варианта,
поскольку |
Замечания: 1. Заданное значение уровня значимости = 0,05 означает, что
т.е. вероятность события { } очень мала. Однако это событие, обладая ненулевой вероятностью, и тогда (при = 0,05 примерно в 5% случаев) будет отвергнута правильная гипотеза. Отвержение гипотезы, когда она верна, называется ошибкой первого рода. Таким образом, уровень значимости - это вероятность ошибки первого рода. Отметим, что ошибкой второго рода называется принятие гипотезы в случае, когда она неверна.
2. Иногда вместо уровня значимости задается надежность :
т.е. - это вероятность попадания значений статистики в область принятия гипотезы. Поскольку события
противоположны, то
Информация о работе Статистические методы обработки экспериментальных данных