Автор работы: Пользователь скрыл имя, 14 Июня 2015 в 10:54, контрольная работа
Научная гипотеза обычно формулируется как теорема и предполагает практическую проверку ее хотя бы в будущем, если в данный момент это неосуществимо. Среди научных гипотез отдельно выделяются статистические гипотезы, но в отличии от большинства научных гипотез, они являются формальным утверждением относительно различий между двумя или несколькими распределениями и предполагают реальную проверку их при помощи существующих методов математической статистики.
Введение
1. Статистическая гипотеза. Статистический критерий
2. Порядок проверки статистических гипотез
Заключение
Список литературы
1. Статистическая гипотеза. Статистический критерий
2. Порядок проверки статистических гипотез
Заключение
Список литературы
Научная гипотеза – это обоснованное и развитое содержательное предположение о неочевидных явлениях и событиях. Этими явлениями и событиями могут быть факты и феномены объекта или предмета исследования, связи между исследуемыми переменными, отличие одних объектов от других по каким-либо параметрам и т.д.
Научная гипотеза обычно формулируется как теорема и предполагает практическую проверку ее хотя бы в будущем, если в данный момент это неосуществимо. Среди научных гипотез отдельно выделяются статистические гипотезы, но в отличии от большинства научных гипотез, они являются формальным утверждением относительно различий между двумя или несколькими распределениями и предполагают реальную проверку их при помощи существующих методов математической статистики.
1. Статистическая гипотеза. Статистический критерий
На разных этапах статистического исследования возникает необходимость в формулировании и экспериментальной проверке некоторых предположительных утверждений (гипотез). Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.
Формулирование гипотез систематизирует предположения исследователя и представляет их в четком и лаконичном виде. Благодаря гипотезам исследователь не теряет путеводной нити в процессе расчетов и ему легко понять после их окончания, что, собственно, он обнаружил.
Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные.
Нулевая гипотеза – это гипотеза об отсутствии различий. Она обозначается как H0 и называется нулевой потому, что содержит число 0: X1 – Х2=0, где X1, X2 – сопоставляемые значения признаков.
Нулевая гипотеза – это то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий.
Альтернативная гипотеза – это гипотеза о значимости различий. Она обозначается как H1. Альтернативная гипотеза – это то, что мы хотим доказать, поэтому иногда ее называют экспериментальной гипотезой.
Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные испытуемые получают хотя и различные, но уравновешенные по трудности задания, или что экспериментальная и контрольная выборки не различаются между собой по каким-то значимым характеристикам. Однако чаще нам все-таки требуется доказать значимость различий, ибо они более информативны для нас в поиске нового. Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.
Направленные гипотезы
H0: X1 не превышает Х2
H1: X1 превышает Х2
Ненаправленные гипотезы
H0: X1 не отличается от Х2
Н1: Х1 отличается от Х2
Если вы заметили, что в одной из групп индивидуальные значения испытуемых по какому-либо признаку, например по социальной смелости, выше, а в другой ниже, то для проверки значимости этих различий нам необходимо сформулировать направленные гипотезы.
Если мы хотим доказать, что в группе А под влиянием каких-то экспериментальных воздействий произошли более выраженные изменения, чем в группе Б, то нам тоже необходимо сформулировать направленные гипотезы.
Если же мы хотим доказать, что различаются формы распределения признака в группе А и Б, то формулируются ненаправленные гипотезы.
При описании каждого критерия в руководстве даны формулировки гипотез, которые он помогает нам проверить.
Ниже рассматривается схема – классификация статистических гипотез.
Статистические гипотезы
Направленные Ненаправленные
Нулевая Альтернативная
Проверка гипотез осуществляется с помощью критериев статистической оценки различий.
Статистическим критерием (К) называется случайная величина, точное или приближённое распределение, которой известно и которая служит для проверки справедливости нулевой гипотезы.
Множество возможных значений критерия делится на две непересекающихся области:
1) значения, при которых нулевая гипотеза справедлива (область принятия гипотезы).
2) значения, при которых нулевая гипотеза отвергается (критическая область).
Критическая область может быть односторонней (левосторонней, правосторонней) или двусторонней.
Рис. 1. Виды критических областей: правосторонняя, левосторонняя и двусторонняя.
Точка Ккр, отделяющая критическую область от области принятия гипотезы, называется критической точкой.
Чтобы определить критическую область, выбирают число q-уровень значимости. q – вероятность того, что при справедливости нулевой гипотезы значение критерия К попадает в критическую область. Тогда для правосторонней критической области Ккр определяется из условия:
P {K > Kkp } = q.
Значение критерия табулировано, т.е. Kkp можно найти по таблице распределения критических точек в зависимости от уровня значимости q и числа степеней свободы f. – Наблюдаемое значение критерия Kнабл определяется по результатам эксперимента.
Если Kнабл<Kkp, то гипотеза H0 принимается. Если Kнабл>Kkp, то H0 отвергается, а принимается конкурирующая гинотеза H1.
Для левосторонней критической области критическая точка определяется из условия: P {K < Kkp } = q.
Для двухсторонней: P {K < K’kp } + P {K > K»kp } = q.
Если двусторонняя область симметрична относительно начала координат, то: P {K < K’kp } = .
Так как наблюдаемое значение критерия определялось по результатам эксперимента, то Кнабл-случайная величина и, следовательно, могут возникать ошибки при принятии гипотезы. Различают ошибки первого и второго рода. К ошибкам первого рода относят те, при которых отвергается правильная гипотеза. К ошибкам второго рода, относят те, при которых принимается неправильная гипотеза. Допустимой вероятностью ошибки первого рода является q-уровень значимости. Однако. если уменьшать q, то возрастает вероятность принятия неверной гипотезы, т.е. вероятность ошибок второго рода. Если справедлива гипотеза H1, то это считается доказанным, если справедлива гипотеза H0-то говорят, что результаты эксперимента не противоречат нулевой гипотезы. Для того чтобы считать H0 доказанной нужно или вновь повторить эксперимент или проверить гипотезу с помощью других критериев.
2. Порядок проверки
Проверка гипотезы основывается на вычислении некоторой случайной величины – критерия, точное или приближенное распределение которого известно. Обозначим эту величину через z, ее значение является функцией от элементов выборки z=z(x1, x2, …, xn). Процедура проверки гипотезы предписывает каждому значению критерия одно из двух решений – принять или отвергнуть гипотезу. Тем самым все выборочное пространство и соответственно множество значений критерия делятся на два непересекающихся подмножества S0 и S1. Если значение критерия z попадает в область S0, то гипотеза принимается, а если в область S1, – гипотеза отклоняется. Множество S0 называется областью принятия гипотезы или областью допустимых значений, а множество S1 – областью отклонения гипотезы или критической областью. Выбор одной области однозначно определяет и другую область.
Принятие или отклонение гипотезы Н0 по случайной выборке соответствует истине с некоторой вероятностью и, соответственно, возможны два рода ошибок. Ошибка первого рода возникает с вероятностью a тогда, когда отвергается верная гипотеза Н0 и принимается конкурирующая гипотеза Н1. Ошибка второго рода возникает с вероятностью b в том случае, когда принимается неверная гипотеза Н0, в то время как справедлива конкурирующая гипотеза Н1. Доверительная вероятность – это вероятность не совершить ошибку первого рода и принять верную гипотезу Н0. Вероятность отвергнуть ложную гипотезу Н0 называется мощностью критерия. Следовательно, при проверке гипотезы возможны четыре варианта исходов, табл. 3.1.
Таблица 3.1.
Гипотеза Н0 |
Решение |
Вероятность |
Примечание |
Верна |
Принимается |
1-a |
Доверительная вероятность |
Отвергается |
a |
Вероятность ошибки первого рода | |
Неверна |
Принимается |
b |
Вероятность ошибки второго рода |
Отвергается |
1-b |
Мощность критерия |
Например, рассмотрим случай, когда некоторая несмещенная оценка параметра q вычислена по выборке объема n, и эта оценка имеет плотность распределения f(q), рис. 3.1.
Рис. 3.1. Области и отклонения гипотезы
Предположим, что истинное значение оцениваемого параметра равно Т. Если рассматривать гипотезу Н0 о равенстве q =Т, то насколько велико должно быть различие между q и Т, чтобы эту гипотезу отвергнуть. Ответить на данный вопрос можно в статистическом смысле, рассматривая вероятность достижения некоторой заданной разности между q и Т на основе выборочного распределения параметра q.
Целесообразно полагать одинаковыми значения вероятности выхода параметра q за нижний и верхний пределы интервала. Такое допущение во многих случаях позволяет минимизировать доверительный интервал, т.е. повысить мощность критерия проверки. Суммарная вероятность того, что параметр q выйдет за пределы интервала с границами q 1–a /2 и q a /2, составляет величину a. Эту величину следует выбрать настолько малой, чтобы выход за пределы интервала был маловероятен. Если оценка параметра попала в заданный интервал, то в таком случае нет оснований подвергать сомнению проверяемую гипотезу, следовательно, гипотезу равенства q =Т можно принять. Но если после получения выборки окажется, что оценка выходит за установленные пределы, то в этом случае есть серьезные основания отвергнуть гипотезу Н0. Отсюда следует, что вероятность допустить ошибку первого рода равна a (равна уровню значимости критерия).
Если предположить, например, что истинное значение параметра в действительности равно Т+d, то согласно гипотезе Н0 о равенстве q =Т – вероятность того, что оценка параметра q попадет в область принятия гипотезы, составит b, рис. 3.2.
Рис. 3.2
При заданном объеме выборки вероятность совершения ошибки первого рода можно уменьшить, снижая уровень значимости a. Однако при этом увеличивается вероятность ошибки второго рода b (снижается мощность критерия). Аналогичные рассуждения можно провести для случая, когда истинное значение параметра равно Т – d.
Заключение
Единственный способ уменьшить обе вероятности состоит в увеличении объема выборки (плотность распределения оценки параметра при этом становится более «узкой»). При выборе критической области руководствуются правилом Неймана – Пирсона: следует так выбирать критическую область, чтобы вероятность a была мала, если гипотеза верна, и велика в противном случае. Однако выбор конкретного значения a относительно произволен. Употребительные значения лежат в пределах от 0,001 до 0,2. В целях упрощения ручных расчетов составлены таблицы интервалов с границами q 1–a /2 и q a /2 для типовых значений a и различных способов построения критерия.
При выборе уровня значимости необходимо учитывать мощность критерия при альтернативной гипотезе. Иногда большая мощность критерия оказывается существеннее малого уровня значимости, и его значение выбирают относительно большим, например 0,2. Такой выбор оправдан, если последствия ошибок второго рода более существенны, чем ошибок первого рода. Например, если отвергнуто правильное решение «продолжить работу пользователей с текущими паролями», то ошибка первого рода приведет к некоторой задержке в нормальном функционировании системы, связанной со сменой паролей. Если же принято решения не менять пароли, несмотря на опасность несанкционированного доступа посторонних лиц к информации, то эта ошибка повлечет более серьезные последствия.
В зависимости от сущности проверяемой гипотезы и используемых мер расхождения оценки характеристики от ее теоретического значения применяют различные критерии. К числу наиболее часто применяемых критериев для проверки гипотез о законах распределения относят критерии хи-квадрат Пирсона, Колмогорова, Мизеса, Вилкоксона, о значениях параметров – критерии Фишера, Стьюдента.
Список литературы