Автор работы: Пользователь скрыл имя, 15 Марта 2011 в 19:27, контрольная работа
В общем виде эту задачу можно поставить следующим образом: пусть мы наблюдаем m независимых нормально распределенных случайных величин (1) предполагая, что все они имеют одинаковую дисперсию (эту гипотезу можно проверить с помощью F-критерия). Средние значения случайных величин (2) вообще говоря, различны
В общем виде эту задачу можно поставить следующим образом: пусть мы наблюдаем m независимых нормально распределенных случайных величин (1) предполагая, что все они имеют одинаковую дисперсию (эту гипотезу можно проверить с помощью F-критерия). Средние значения случайных величин (2) вообще говоря, различны. Пусть в одинаковых экспериментальных условиях над каждой из переменных (1) производится некоторая серия наблюдений (для простоты ограничимся случаем равночисленных наблюдений, хотя это обстоятельство несущественно для теории). Данные k-й серии пусть будут (k=1,2,…..,m) (3).
Опираясь на эти статистические данные, мы хотим проверить гипотезу, согласно которой средние значения (2) равны, т.е. a1=a2=…..=am(4)
Если проверяемая гипотеза, называемая нулевой гипотезой, верна. поставив средние в каждой серии, мы не должны получить ш расхождения между ними; если такое расхождение обнаружено то гипотезу (3) приходится отбросить.
Примером подобной ситуации может служить статистическое исследование урожайности сельскохозяйственной культуры в зависимости от 1 из m сортов почвы при некотором способе ее обработки. Истинное значение урожайности для каждого из m сортов почвы неизвестно, а экспериментально наблюдаемые урожайности (3) в каждом из n экспериментов на этих сортах почвы содержат ошибки, возникающие из-за тех или иных случайных причин. Будет ли одинаковой урожайность на всех сортах почвы, если предположить, что измерения (3) проводились с ‚одинаковой точностью и в одинаковых условиях? Иначе говоря, мы хотим проверить влияние одного фактора сорта почвы — на урожайность .сельскохозяйственной культуры. В другой постановке та же задача возникает, если мы хотим проверить, насколько влияют и влияют ли вообще на плодородие почвы источники загрязнения. В этом случае сорт почвы может меняться и давать разную урожайность в зависимости от удаленности обрабатываемого участка земли от источника загрязнения.
Таблица результатов измерений будет иметь следующий вид (табл. 1):
Результаты измерений урожайности
Номер сорта почвы |
Номер эксперимента | ||||
1 | 2 | 3 | … | n | |
1 | x11 | X12 | X13 | … | X1n |
2 | X21 | X22 | X23 | … | X2n |
3 | X31 | X32 | X33 | … | X3n |
… | … | … | … | … | … |
m | Xm1 | Xm2 | Xm3 | … | xnm |
Обозначим через среднее арифметическое из n наблюдаемых урожайностей на почве первого сорта, через — среднее из урожайностей в почве второго сорта и т. д., так, что
Систематические
ошибки наблюдений урожайностей на разных
почвах неодинаковы, то мы должны ожидать
повышенного рассеивания
Обозначим
через
Суммирование по k при постоянном i дает сумму по всем наблюдениям i-той серии (т.е. по i-му сорту почвы). Дальнейшее суммирование по i дает итог по всем сортам почвы. Так как
В то же время
причем
Но , так как представляет собой сумму отклонений наблюдений i-й серии от средней этой же серии и потому S=0. (7)
По этому приняв во внимание, что
мы можем основное тождество (6) записать в следующем виде
где
Таким
образом, общая сумма квадратов
‚ распадается на две составные
части, первая из которых связана
с оценкой дисперсии
Предположим теперь, что гипотеза (4) верна, и потому нормальные распределения всех величин (урожайностей) тождественны. имеют одинаковые среднее значение и дисперсию .Тогда же nm наблюдений можно рассматривать как выборку из одной и той же нормальной совокупности .
Можно показать, что при этой гипотезе статистики , и распределены по закону соответственно с , , степенями свободы, а по тому Q, Q1, Q2 могут быть использованы в этом случае для оценки . Эта оценка может быть поведена с помощью несокращенных характеристик
При более детальном изучение показывает, что Q1 и Q2 при нашей гипотезе независимы друг от друга. Заметим, этот вывод справедлив при любых предположениях относительно ai.
Из сказанного вытекает, что критерий
Пусть
с другой стороны наша гипотеза неверна
и средние значения (2) не равны
друг другу, но параметр
По-прежнему является
Если ,то нулевая гипотеза отклоняется, и следует считать, что среди значений имеются хотя бы два не равных друг другу.
Схема однофакторного дисперсионного анализа
Компонента дисперсии | Сумма квадратов | Число степеней свободы | Выборочная дисперсия |
Между сортами почвы | |||
Внутри сортов почвы | |||
Полная (общая) |
Сравнивая дисперсию между сортами почвы с дисперсией «внутри» почвы, по величине их отношения (11) судят, насколько рельефно проявляется влияние такого фактора, как сорт почвы; в этом сравнении как раз и заключается основная идея дисперсионного анализа. Схему однофакторного дисперсионного анализа можно представить в , табл. 2.
В качестве числового примера рассмотрим данные пятикратного (n=5) измерения урожайности на трех (т =3) сортах почвы. В таблице приведены данные не фактического, а условного эксперимента;
Результаты
измерения урожайности в
Номер
Сорта почвы |
Номер эксперимента | Выборочное среднее | ||||
1 | 2 | 3 | 4 | N=5 | ||
i | ||||||
1 | 12 | 15 | 17 | 13 | 16 | |
2 | 20 | 17 | 16 | 25 | 14 | |
m=3 | 10 | 12 | 11 | 13 | 8 |
Из таблицы имеем:
Для нашего примера таблица однофакторного анализа будет иметь следующий вид
дисперсионный анализ урожайности на различных сортах почвы
Компонента дисперсии | Сумма квадратов | Число степеней свободы | Выборочная дисперсия |
Между
сортами
почвы |
Q1=137 | 2 | |
Внутри сортов почвы | Q2=102.2 | 12 | |
Полная (общая) | Q3=239.2 | 14 |
Произведя теперь проверку нулевой гипотезы (4) с помощью распределения, находим
При двух степенях свободы большей дисперсии (k1 = 2) и 12 е свободы меньшей дисперсии (k2 = 12) по табл. в приложении II находим критические границы для F, равные при 5%-м уровне pзначимости и 3.88 и 1%-м уровне — 6.93. Полученное нами из наблюдений значение превышает указанные границы, и потому нулевая гипотеза должна быть отвергнута, т.е. урожайность на рассматриваемых сортах почвы неодинакова.