Однофакторный дисперсионный анализ

Автор работы: Пользователь скрыл имя, 19 Июня 2013 в 10:37, реферат

Описание работы

Во многих экономико-социальных задачах требуется оценить влияние одного или нескольких различных качественных факторов на изучаемую количественную характеристику величины Х. Например, разные формы организации производства могут оказывать существенное и несущественное влияние на прибыль фирмы или предприятия. Другим примером может служить задача оценки эффективности различных видов удобрений на урожайность.

Файлы: 1 файл

Lektsii_po_mat_stat_dlya_prikladnikov_3.docx

— 189.56 Кб (Скачать файл)

Однофакторный дисперсионный  анализ

 

 

 Во многих экономико-социальных задачах требуется оценить влияние одного или нескольких различных качественных факторов на изучаемую количественную характеристику величины Х. Например, разные формы организации производства могут оказывать существенное и несущественное влияние на прибыль фирмы или предприятия. Другим примером может служить задача оценки эффективности различных видов удобрений на урожайность.

Суть метода заключается  в том, что 

а) данный фактор (факторы) А можно разделить на ряд уровней, в качестве которых могут выступать, например, разные формы организации производства или разные виды удобрений,

б) дисперсия величины Х может быть разделена на 2 части: одна часть – факторная дисперсия вызвана действием различных уровней фактора(факторов) А, вторая – остаточная дисперсия, обусловленная неконтролируемыми, случайными воздействиями.

Если выясняется, что факторная  дисперсия не велика по сравнению  с остаточной, то считается, что фактор (факторы) А не оказывает(ют) существенного влияния на изучаемую величину Х.

Если рассматривается  один фактор, дисперсионный анализ называется однофакторным, если более  одного – многофакторным.

 

6.2. Алгоритм однофакторного дисперсионного анализа

 

а) Пусть на рассматриваемую количественную величину Х влияет качественный фактор А, который имеет k уровней. Для каждого уровня фактора А проводится одинаковое количество измерений величины Х.  Число таких измерений на каждом из уровней равно n. Результаты измерений представляются в виде таблицы (табл. 1).

Замечание.  В обозначениях индексов переменных величин таблицы будем следовать  правилам алгебры матриц: строки будем  обозна0чать индексом i, а столбцы – индексом j; для переменных с двумя индексами: первый индекс – номер строки, а второй индекс – номер столбца.

б) В последней строке помещены средние значения измерений     для каждого уровня j фактора А, найденные по формуле

в) Рассмотрим основные понятия дисперсионного анализа.

1. Общей средней по всем измерениям (общее число измерений равно k·n) является величина, равная

Таблица 1

Номер измерений,

Уровни фактора,

A1

A2

Aj

Ak

1

X11

X12

X1j

X1k

2

X21

X22

X2j

X2k

i

Xi1

Xi2

Xij

Xik

n

Xn1

Xn2

Xnj

Xnk

Групповая средняя




2. Общей суммой квадратов отклонений измеренных значений xij от общей средней называется выражение:

3. Факторной суммой квадратов отклонений групповых средних от общей средней называется выражение:

4. Остаточной суммой квадратов отклонений измеренных значений от групповых средних служит сумма Qост, равная Qост=Qобщ-Qфакт.

г) Итак, подсчитав общую сумму Qобщ, факторную сумму Qфакт, и остаточную сумму Qост, можно получить дисперсии: общую – S2общ, факторную – S2факт и остаточную – S2ост. Дисперсия S2общ обязана своим появлением всем действующим факторам: как фактору А, так и фактору случайности на каждом уровне. Основная задача, которую решает дисперсионный анализ – это разложение общей дисперсии S2общ на составляющие, которые характеризовали бы фактор А и фактор случайности в отдельности.

С учетом того, что факторная дисперсия S2факт зависит от k составляющих и является смещенной оценкой, то формула для несмещенной оценки дисперсии принимает вид:

Остаточная  дисперсия S2ост зависит от Xij(i= j=), т.е. от k·n составляющих. Следовательно, для несмещенной остаточной дисперсии имеем

.

Здесь число  степеней свободы по сравнению с  n·k уменьшено на k, так как в каждой группе за счет групповой средней число степеней свободы уменьшается на единицу.

д) Для проверки нулевой гипотезы Н0 о незначимом влиянии фактора А  используем критерий Фишера – Снедекора, т.е. случай-ную функцию

равную отношению выборочных дисперсий двух нормально распределенных случайных величин (во всех случаях полагаем, что совокупности данных измерений распределены по нормальному закону).

По таблице  распределения Фишера для уровня значимости α = 0,05 и степеням свободы  k1=k-1,  k2=k(n-1), находим Fкрит(0,05; k1; k2).

е) Если Fкрит>Fрасч, то заключаем, что фактор влияет несущественно, и принимаем нулевую гипотезу.

Если Fкрит<Fрасч, то заключаем, что фактор влияет существенно, и нулевую гипотезу отвергаем.

Пример 1. В трех магазинах продаются мобильные телефоны трех цветов. В таблице указаны объемы дневных продаж по магазинам и цветам.

Таблица 2

Номер магазина,

Фактор цвета, Aj,

Красные –А1

Желтые – А2

Зеленые – А3

Маг 1

3

5

2

Маг 2

4

1

3

Маг 3

2

8

6

Групповая средняя


На уровне значимости α = 0,05 установить влияние  фактора цвета на объема продаж.

 

Решение:

1. Находим групповое среднее значение спроса для каждого цвета (уровня):

   

 

2. Находим общую среднюю:   

   

3. Вычислим разность  и квадраты этих разностей (табл.3)

Таблица 3

Номер магазина,

Цвета (факторы), Аj,

Красные – А1

Желтые – А2

Зеленые – А3

yi1

yi12

yi2

yi22

yi3

yi32

1

2

3

-

-

-


 

4. Найдем общую и факторную суммы:

а). общую сумму:

  ;

б). факторную сумму:

 

5. Вычислим остаточную сумму:

6. Определим факторную и остаточную дисперсию:

7. Для проверки нулевой гипотезы о незначимости фактора цвета для объема продаж (при уровне значимости α = 0,05) используем критерий Фишера-Снедекора , в предположении, что факторная и остаточная дисперсии распределены нормально.

8. Находим расчетное значение критерия:

9. По таблице распределения Фишера - Снедекора для уровня значимости α=0,05 и степеней свободы: k1=k-1=3-1=2;  k2=k(n-1)=3(3-1)=6,  находим Fкрит(0,05;2;6)=5,14.

10. Так как , то заключаем, что фактор (цвет) существенно не влияет на продажу мобильных телефонов и нулевую гипотезу принимаем.

 

Пример 2. Проведены измерения для каждого из трех уровней некоторого фактора А. В качестве уровня значимости принимается величина α=0,05. Проверить нулевую гипотезу о незначительном влиянии фактора А.

Исходные  данные помещены в табл. 4

Таблица 4

 

 
Номер измерений,

Уровни фактора Аj , j=(1,2,3)

A1

A2

A3

1

38

20

21

2

36

24

22

3

35

26

31

4

31

30

34

Групповая средняя

35

25

27


 

Решение:

1. В нашем примере k=3, n=4.

2. Находим общую среднюю:

3. Для нахождения общей факторной сумм измерений вычислим разности yij=Xij - = Xij -29 и квадраты этих разностей (составим табл.5)

Таблица 5

Номер измерений, i

Уровни фактора, Аj

A1

A2

A3

yi1

yi12

yi2

yi22

yi3

yi32

1

9

81

-9

81

-8

64

2

7

49

-5

25

-7

49

3

6

36

-3

9

2

4

4

2

4

1

1

5

25

-

170

-

116

-

142


 

4. Находим:

а) общую сумму:

б) факторную  сумму:

в) остаточную сумму:

Qост=Qобщ-Qфакт=428-224=204.

г) факторную  дисперсию:

д) остаточную дисперсию:

 

5. Для проверки нулевой гипотезы используем критерий Фишера-Снедекора:

6. По таблице распределения Фишера-Снедекора для уровня значимости α=0,05 и степеням свободы k1=k-1=2  и k2=k(n-1)=3*3=9, находим Fкрит(0.05; 2; 9)=4.26

Так как Fкрит=4,26<Fрасч=4,96, то заключаем, что фактор влияет существенно, и нулевую гипотезу отвергаем.

Корреляционная, статистическая и функциональная зависимость

 

Основной  задачей регрессионного анализа является установление  формы и изучение зависимости между переменными.

Предметом исследования корреляционного анализ является связь (зависимость) между различными варьирующими признаками (переменными величинами), при которой каждому значению одной переменной соответствует не определенное значение другой (как это имеет место при функциональной зависимости), а ряд распределения с определенной групповой средней.

Конечная цель корреляционного  анализа – получение уравнений  прямых регрессии, характеризующих  форму зависимости, и вычисление коэффициента корреляции, определяющего  тесноту (силу) связи, если она линейная.

В качестве измерителей степени  тесноты парных связей между количественными  переменными используются коэффициент  корреляции и корреляционное отношение. Заметим, что корреляционный момент (или коэффициент корреляции) используют в качестве количественной меры зависимости  случайных величин, а в качестве математической модели этой зависимости  применяют уравнение регрессии.

Обозначим через Х независимую переменную, а через Y – зависимую переменную. Зависимость величины Y от Х называется функциональной, если каждому значению величины Х соответствует единственное значение величины Y.

Гораздо чаще в окружающем нас мире имеет  место не функциональная, а статистическая (или вероятностная) зависимость, когда каждому фиксированному значению независимой переменной Х соответствует не одно, а множество значений переменной Y, причем сказать заранее, какое именно значение примет величина Y, нельзя.

Если  при изменении одной из величин  изменяется среднее значение другой, то стохастическая зависимость называется корреляционной.

7.2. Прямая регрессии. Линейная корреляция

Приведем пример такой зависимости: пусть Y – урожай зерна, Х – количество удобрений. С одинаковых по площади участков при равном количестве внесенных удобрений снимают разный урожай, т.е. Y не является функцией от Х. Это объясняется влиянием случайных факторов: осадки, температура и т.п. Но опыт показывает, что средний урожай является функцией от количества удобрений, Y связан с Х корреляционной зависимостью: при изменении количества вносимых удобрений изменяется и средний урожай, т.е. математическое ожидание величины Y изменяется при изменении значения Х. Такое математическое ожидание мы называем условным (см. формулу (3.6) п. 3.1) и обозначим М(Y/Х = х).

Информация о работе Однофакторный дисперсионный анализ