Дисперсионный анализ с повторными изменениями

Автор работы: Пользователь скрыл имя, 14 Мая 2012 в 18:36, реферат

Описание работы

Однофакторный дисперсионный анализ в SPSS реализуется с помощью команды One-way ANOVA (Однофакторный дисперсионный анализ). Команды подменю General Linear Model (Общие линейные модели) также отчасти позволяют проводить подобный анализ, однако их возможности несколько уже, чем у команды One-way ANOVA (Однофакторный дисперсионный анализ).

Содержание работы

1. Однофакторный дисперсионный анализ 3
Пошаговые алгоритмы вычислений 4
Представление результатов 14
2. Многофакторный дисперсионный анализ 19
Дисперсионный анализ с двумя факторами 20
Дисперсионный анализ с тремя и более факторами 22
Влияние ковариат 23
Пошаговые алгоритмы вычислений 24
Печать результатов и выход из программы 31
Представление результатов 31
Терминология, используемая при выводе 36
3. Многомерный дисперсионный анализ 37
Пошаговые алгоритмы вычислений 40
Печать результатов и выход из программы 50
Представление результатов 50
4. Дисперсионный анализ с повторными изменениями 57
Пошаговые алгоритмы вычислений 59
Печать результатов и выход из программы 66
Представление результатов 67

Файлы: 1 файл

Содержание.doc

— 5.57 Мб (Скачать файл)

51

 

 


Содержание

1. Однофакторный дисперсионный анализ              3

Пошаговые алгоритмы вычислений              4

Представление результатов              14

2. Многофакторный дисперсионный анализ              19

Дисперсионный анализ с двумя факторами              20

Дисперсионный анализ с тремя и более факторами              22

Влияние ковариат              23

Пошаговые алгоритмы вычислений              24

Печать результатов и выход из программы              31

Представление результатов              31

Терминология, используемая при выводе              36

3. Многомерный дисперсионный анализ              37

Пошаговые алгоритмы вычислений              40

Печать результатов и выход из программы              50

Представление результатов              50

4. Дисперсионный анализ с повторными изменениями              57

Пошаговые алгоритмы вычислений              59

Печать результатов и выход из программы              66

Представление результатов              67


1. Однофакторный дисперсионный анализ

Однофакторный дисперсионный анализ в SPSS реализуется с помощью команды One-way ANOVA (Однофакторный дисперсионный анализ). Команды подменю General Linear Model (Общие линейные модели) также отчасти позволяют проводить подобный анализ, однако их возможности несколько уже, чем у команды One-way ANOVA (Однофакторный дисперсионный анализ).

Дисперсионный анализ (Analysis Of Variances, ANOVA) это процедура сравнения средних значений выборок, на основании которой можно сделать вывод о соотношении средних значений генеральных совокупностей. Ближайшим и более простым аналогом ANOVA является it-критерий. В отличие от t-критерия дисперсионный анализ предназначен для сравнения не двух, а нескольких выборок. Слово «дисперсионный» в названии указывает на то, что в процессе анализа сопоставляются компоненты дисперсии изучаемой переменной. Общая изменчивость переменной раскладывается на две составляющие: межгрупповую (факторную), обусловленную различием групп (средних значений), и внутригрупповую (ошибки), обусловленную случайными (неучтенными) причинами. Чем больше частное от деления межгрупповой и изменчивости (F-отношение), тем больше различаются средние значения сравниваемых выборок, и тем выше статистическая значимость этого различия.

Итак, название указывает на то, что вывод о различии средних значений делается основе анализа компонентов дисперсии. А что означает слово «Однофакторный»? Применяя команду One-way ANOVA (Однофакторный дисперсионный анализ), вы увидите, что в ней можно задать единственную зависимую переменную (при этом она должна быть количественного, а точнее метрического типа) и независимую (всегда номинальную, имеющую несколько градаций). Различные модели дисперсионного анализа допускают наличие нескольких независимых переменных. Многомерный дисперсионный анализ позволяет анализировать как множество независимых, так и множество зависимых переменных.

Итак, при однофакторном дисперсионном анализе сравниваются средние значения каждой выборки друг с другом и вычисляется общий уровень значимости различий. Необходимо обратить внимание на то, что вывод по результатам ANOVA касается общего различия всех сравниваемых средних без конкретизации того, какие именно выборки различаются, а какие нет. Для идентификации пар выборок, отличающихся друг от друга средними значениями, используются методы парных сравнений постфактум (Post Hoc), а для более сложных сопоставлений – метод контрастов (Contrasts).

Пошаговые алгоритмы вычислений

Для проведения однофакторного дисперсионного анализа будет использоваться файл ех01.sav. В роли зависимой переменной выступит переменная тест1, а независимая переменная класс разделит объекты на 3 выборки, средние значения которых мы будем сравнивать, но сначала необходимо выполнить три подготовительных шага.

Шаг 1.Создайте новый файл данных или подготовьте существующий.

Шаг 2 Запустите программу SPPS при помощи значка на рабочем столе или команды Пуск – Программы SPPS for WindowsSPS 11.5 for Windows (StartPrograms SPPS for WindowsSPS 11.5 for Windows) главного меню Windows. В открывшемся после запуска программы диалоговом окне SPPS щелкните на кнопке Сancel (Отмена). После выполнения этого шага на экране появится окно редактора данных SPPS.

Шаг 3. Откройте файл данных, с которым вы намерены работать (в нашем случае это файл ех01.sav). Если он расположен в текущей папке, то выполните следующие действия:

1. Выберите в меню File (Файл) команду Оpen Data (Открытие – Данные) или щелкните на кнопке Ореn File (Открытие файла) панели инструментов.

2. В открывшемся диалоговом окне дважды щелкните на имени ех01.sау или введите его с клавиатуры и щелкните на кнопке ОК.

Независимо от того, открыта программа SPPS только что или какие-то процедуры уже выполнялись, в верхней части главного окна должна присутствовать строка меню. Пока строка меню присутствует на экране, доступны все команды анализа данных. При этом окно с данными видеть не обязательно.

При работе с таблицами или при редактировании диаграмм некоторые пункты строки меню могут исчезать или меняться. Чтобы вернуться к главному окну и стандартной строке меню, щелкните на кнопке свертывания или восстановления текущего окна.

Однофакторный дисперсионный анализ

После завершения шага 3 на экране должно присутствовать окно редактора данных со строкой меню.

Шаг 4. В меню Analyze (Анализ) выберите команду Compare MeansOne-Way ANOVA (Сравнение средних – Однофакторный дисперсионный анализ). На экране появится диалоговое окно One-Way ANOVA (Однофакторный дисперсионный анализ), показанное на рисунке 1.

Рис. 1. Диалоговое окно One-Way ANOVA

Структура диалогового окна One-Way ANOVA (Однофакторный дисперсионный анализ) вполне типична для большинства диалоговых окон SPSS. Слева мы видим список переменных текущего файла данных. В нижней части окна расположены три кнопки: Options (Параметры), Post Hoc (Апостериорные критерии) и Contrasts (Контрасты), которые мы будем использовать при обработке. Список Dependent List (Зависимые переменные) предназначен для задания одной или нескольких зависимых переменных (в нашем примере будет использоваться единственная зависимая переменная тест 1). Зависимые переменные должны быть метрического типа. Если в списке указано несколько зависимых переменных, то SPSS выполнит ANOVA для каждой из них. Под списком Dependent List (Зависимые переменные) находится поле Factor (Фактор), в котором нужно указать единственную независимую переменную, имеющую несколько градаций (в нашем случае – хобби). Таким образом, мы сравним результаты первого теста («счет в уме») для трех групп учащихся, различающихся внешкольными увлечениями.

Иногда возникает необходимость сравнивать не все выборки, соответствующие градациям фактора (независимой переменной), а лишь часть из них. В этом случае перед проведением анализа необходимо обратиться к команде Select Cases (Выбор объектов) для выбора необходимых для анализа градаций фактора.

На шаге 5 мы будем сравнивать между собой средние значения переменной тест1 для каждой из выборок по уровням переменной хобби.

Шаг 5. После выполнения шага 4 должно быть открыто диалоговое окно One-Way ANOVA днофакторный дисперсионный анализ), показанное на рис. 1. При необходимости повторите шаг 4 и выполните следующие действия:

1. Щелкните сначала на переменной тест1, чтобы выделить ее, а затем на верхней кнопке со стрелкой, чтобы переместить переменную в список Dependent List (Зависимые переменные).

2. Щелкните сначала на переменной хобби, чтобы выделить ее, а затем на нижней кнопке со стрелкой, чтобы переместить переменную в поле Factor (Фактор).

3. Щелкните на кнопке ОК, чтобы открыть окно вывода.

Существует два дополнительных действия, которые иногда желательно выполнять в процессе анализа. Приведенная последовательность инструкций позволяет получить результаты средних выборок, однако ни сами средние значения, ни результаты выборок в выводимых данных отображены не будут. Первая проблема решается при помощи кнопки Options (Параметры). Диалоговое окно One-Way ANOVA: Options (Однофакторный дисперсионный анализ: Параметры), появляющееся после щелчка на ней, представлено на рис. 2. Установка флажка Descriptive (Описательные статистики) приведет к включению в выводимые данные всех средних значений, стандартных отклонений, стандартных ошибок, границ доверительных интервалов в 95 %, а также минимумов и максимумов выборок. Флажок Homogeneity of variance test (Критерий однородности дисперсии) позволяет вывести о степени пригодности данных к дисперсионному анализу, а с помощью флажка Means plot (График средних) можно построить диаграмму, на которой будут изображены средние значения для каждой выборки. Группа переключателей Missing Values (Пропущенные значения) позволяет выбрать способ обработки отсутствующих значений.

Рис. 2. Диалоговое окно One-Way ANOVA: Options

Парные сравнения

Нередко нас могут заинтересовать результаты парных сравнений градаций независимой переменной, и для этой цели в диалоговом окне One-Way ANOVA (Однофакторный дисперсионный анализ) предусмотрена специальная кнопка Post Hoc (Апостериорные критерии). Слово «апостериорные критерии» означает, что эта процедура проводится после установления статистически достоверного результата однофакторного дисперсионного анализа. Если результаты ANOVA оказались статистически недостоверными, применение процедуры парных сравнений некорректно. При щелчке на кнопке Post Hoc (Апостериорные) открывается диалоговое окно One-Way ANOVA: Post Hoc Multiple Comparisons (Однофакторный дисперсионный анализ: Апостериорные критерии множественных сравнений), представленное на рис. 3. Это диалоговое окно с помощью флажков позволяет задать 14 критериев для выборок с одинаковой дисперсией и 4 критерия для выборок с разной дисперсией. Число предлагаемых критериев настолько велико, что даже руководство пользователя программы SPSS объемом около 3000 страниц оказалось не в состоянии вместить описания их всех.

Рис. 3. Диалоговое окно One-Way ANOVA: Post Hoc Multiple Comparisons

Большинство из указанных тестов используются очень редко, поэтому ниже приведены описания только нескольких наиболее популярных.

- LSD (Least Significant Difference Наименьшая значимая разность) – этот тест представляет собой не что иное, как совокупность t-критериев для всех возможных пар градаций фактора. Критерий наименьшей значимой разности является одним из самых «либеральных», поскольку наиболее подвержен ошибкам. Например, если независимая переменная имеет 5 уровней, то будет проведено 10 сравнений. При уровнях значимости каждого из сравнений, равных 0,05, существует вероятность почти в 40 % того, что хотя бы 1 из тестов показал значимый результат случайно.

- Bonferroni критерий Бонферрони схож с критерием наименьшей значимой разности, однако лишен недостатка, связанного с повторными проверками: в нем уровень значимости делится на число сравнений. Таким образом, критерий Бонферрони является более «консервативным».

- Scheffe (Шеффе) – критерий Шеффе еще более «консервативен», чем критерий Бонферрони, использующий F-критерий вместо t-критерия.

- Tukey (Тьюки) – критерий Тьюки использует статистику Стыодента (Student) для определения различий между группами. Этот критерий часто применяется в случаях, когда исследуемый фактор имеет большое количество уровней.

Самыми консервативными из предложенных являются критерии Шеффе и Бонферрони. Часто используется также критерий Тьюки, называемый еще критерием подлинной значимости (Honestly Significant Difference, HSD). HSD представляет собой наименьшую величину разности средних значений выборок, которую можно считать значимой. Например, если HSD = 2,5, а для двух выборок получены величины средних значений 3,7 и 6,3, то разность между ними, равная 2,6, согласно Тьюки, является значимой, поскольку она превышает величину HSD. При использовании критерия Тьюки программа SPSS также включает в вывод дополнительную статистическую информацию.

Необходимо отметить, что все описанные выше критерии (а на самом деле большинство критериев парных сравнений) применяются в предположении, что дисперсии всех ячеек равны. Исключение составляют 4 критерия, флажки для которых выделены в отдельную группу в нижней части диалогового окна One-Way ANOVA: Post Hoc Multiple Comparisons (Однофакторный дисперсионный анализ: Апостериорные критерии множественных сравнений), – они применяются в случаях, когда дисперсии ячеек разные.

В следующем примере мы проведем однофакторный дисперсионный анализ, а в выводимые результаты включим описательные статистики и критерий однородности дисперсии. Для парных сравнений воспользуемся критерием Шеффе. Как и в предыдущем примере, зависимой переменной будет переменная тест1, а независимой – переменная хобби.

Шаг 5а. После выполнения шага 4 должно быть открыто диалоговое окно One-Way ANOVA (Однофакторный дисперсионный анализ), показанное на рис. 1. Если уже успели поработать с этим окном, очистите его щелчком на кнопке Reset (Сброс) и выполните следующие действия:

1. Щелкните сначала на переменной тест 1, чтобы выделить ее, а затем на верхней кнопке со стрелкой, чтобы переместить переменную в список Dependent List (Зависимые переменные).

2. Щелкните сначала на переменной хобби, чтобы выделить ее, а затем на нижней кнопке со стрелкой, чтобы переместить переменную в поле Factor (Фактор).

3. Щелкните на кнопке Options (Параметры), чтобы открыть диалоговое окно One-Way ANOVA: Options (Однофакторный дисперсионный анализ: Параметры), показанное на рис.2.

4. Установите флажки Descriptive (Описательные статистики) и Homogeinity of variance test (Критерий однородности дисперсии), а затем щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно One-Way ANOVA (Однофакторный дисперсионный анализ).

5. Щелкните на кнопке Post Hoc (Апостериорные), чтобы открыть диалоговое окно One-Way ANOVA: Post Hoc Multiple Comparisons (Однофакторный дисперсионный анализ: Апостериорные множественные сравнения), показанное на рис. 3.

6. Установите флажок Sheffe (Шеффе) и щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно One-Way ANOVA (Однофакторный дисперсионный анализ). Щелкните на кнопке ОК, чтобы открыть окно вывода.

7. Щелкните на кнопке ОК, чтобы открыть окно вывода.

Контрасты

Последняя из трех кнопок в окне One-Way ANOVA (Однофакторный дисперсионный анализ) имеет название Contrasts (Контрасты). Она предназначения для вызова диалогового окна One-Way ANOVA: Contrasts (Однофакторный дисперсионный анализ: Контрасты), представленного на рис. 4. Это окно позволяет осуществлять различные сравнения выборок по градациям независимой переменной. Так, вы можете сравнивать одну градацию с другой, одну градацию со всеми остальными или разбить все градации на 2 группы и затем сравнить их между собой. Сравнение сводится к применению модифицированного варианта t-критерия. Отметим, что применение метода контрастов не требует предварительного получения статистически достоверного результата анализа ANOVA, в отличие от процедуры апостериорного множественного парного сравнения.

Рис. 4. Диалоговое окно One-Way ANOVA: Contrasts

В нашем примере независимая переменная хобби имеет 3 градации: 1 – спорт, 2 – компьютер, 3 – искусство. Для задания контраста предназначены поле и список Coefficients (Коэффициенты). Заполнение списка происходит следующим образом. Каждой градации фактора вы должны сопоставить число, определяющее его роль в контрасте: отрицательное число соответствует одной группе, положительное число – другой группе, а ноль означает, что градация в сравнениях не задействована. При этом абсолютные величины коэффициентов не важны, последние должны вводиться в порядке следования градаций и в сумме давать нулевое значение. Например, если вам необходимо сравнить увлекающихся спортом с остальными учащимися, вы можете закодировать градации последовательностью – 2, 1 и 1, а если вы хотите сравнить увлекающихся спортом только с теми, кто увлекается искусством, то необходимо задать последовательность 1, 0 и -1. Не забывайте, что сумма всех коэффициентов обязательно должна равняться 0.

Помещение чисел в список осуществляется путем ввода значения в поле справа от названия списка и щелчка на кнопке Add (Добавление). Если нужно создать несколько «контрастов», то есть разбиений на группы, то щелкните на кнопке Next справа от метки Contrast 1 of 1 (Контраст 1 из 1) и повторите описанную процедуру.

Следующий пример иллюстрирует применение контрастов для сравнения учащихся, увлекающихся компьютером, с теми, кто имеет другие увлечения, а также для сравнения увлекающихся спортом с остальными учащимися.

Шаг 5б. После выполнения шага 4 должно быть открыто диалоговое окно One-Way ANOVA (Однофакторный дисперсионный анализ), показанное на рис. 1. Если вы уже успели поработать с этим окном, очистите его щелчком на кнопке Reset (Сброс) и выполните следующие действия:

1. Щелкните сначала на переменной тест1, чтобы выделить ее, а затем на верхней кнопке со стрелкой, чтобы переместить переменную в список Dependent List (Зависимые переменные).

2. Щелкните сначала на переменной хобби, чтобы выделить ее, а затем на нижней кнопке со стрелкой, чтобы переместить переменную в поле Factor (Фактор).

3. Щелкните на кнопке Options (Параметры), чтобы открыть диалоговое окно One-Way ANOVA: Options (Однофакторный дисперсионный анализ: Параметры), показанное на рис. 2.

4. Установите флажки Descriptive (Описательные статистики) и Homogeinity of variance test (Критерий однородности дисперсии), а затем щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно One-Way ANOVA (Однофакторный дисперсионный анализ).

5. Щелкните на кнопке Post Нос (Постфактум), чтобы открыть диалоговое окно One-Way ANOVA: Post Hoc Multiple Comparisons (Однофакторный дисперсионный анализ: Множественные сравнения постфактум), показанное на рис. 3.

6. Установите флажок LSD (Наименьшая значимая разность) и щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно One-Way ANOVA (Однофакторный дисперсионный анализ).

7. Щелкните на кнопке Contrasts (Контрасты), чтобы открыть диалоговое окно One-Way ANOVA: Contrasts (Однофакторный дисперсионный анализ: Контрасты), представленное на рис. 4.

8. Нажмите клавишу Tab, чтобы перевести фокус ввода в поле Coefficients (Коэффициенты), введите число 1 и щелкните на кнопке Add (Добавление), задав первое число в списке.

9. Повторите предыдущее действие сначала для чисел -2 и 1, затем, щелкнув на кнопке Next (Следующий), – для чисел -2, 1, 1, после чего щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно One-Way ANOVA (Однофакторный дисперсионный анализ).

10. Щелкните на кнопке ОК, чтобы открыть окно вывода.

После выполнения шага 5 программа автоматически активизирует окно вывода. Для просмотра результатов вы при необходимости можете воспользоваться вертикальной и горизонтальной полосами прокрутки. Обратите внимание на стандартную строку меню в верхней части окна вывода: ее присутствие позволяет выполнять любые статистические операции, не переключаясь обратно в окно редактора данных.

Осталось сделать два последних шага, на которых производится печать выбранных результатов и выход из программы.

Шаг 6. В окне вывода укажите фрагменты, выводимые на печать, в меню File (Файл) выберите команду Print (Печать), при необходимости задайте параметры печати и щелкните на кнопке ОК. Последнее, что необходимо сделать после завершения исследования и печати результатов, – это выйти из программы SPSS.

Шаг 7. Для выхода из программы в меню File (Файл) выберите команду Exit (Выход).

Иногда после выполнения команды Exit (Выход) на экране могут появляться небольшие диалоговые окна с вопросом о необходимости сохранения сделанных в файлах изменений и кнопками, описывающими возможные варианты ответа. Для завершения работы просто щелкайте на соответствующих кнопках.

Представление результатов

В этом разделе мы приводим некоторые результаты процедур, описываемых в этой главе.

Однофакторный дисперсионный анализ

На рис. 5 приведен фрагмент выводимых данных, сгенерированных программой после выполнения шага 5а, относящийся к однофакторному дисперсионному анализу.

Рис.5. Фрагмент окна вывода после выполнения шага 5а, относящийся к однофакторному дисперсионному анализу

Самым важным значением в этой таблице является уровень значимости р = 0,002. Он указывает на то, что разность между средними значениями переменной тест1 для трех групп статистически достоверна. Далее дана трактовка терминов, используемых программой в окне вывода.

- Значение в столбце Sum of Squares (Сумма квадратов) строки Between Croups (Между группами) представляет собой сумму квадратов разностей между общим средним значением и средними каждой группы, умноженными на весовые коэффициенты, равные числу объектов в группе, а строки Within Croups (Внутри групп) – сумму квадратов разностей среднего значения каждой группы и каждого значения этой группы.

- Значение в столбце df (ст. св.) строки Between Groups (Между группами) представляет собой межгрупповое число степеней свободы, числу групп, уменьшенному на 1, в строки Within Croups (Внутри групп) – внутригрупповое число степеней свободы, равное разности между числом объектов и числом групп, уменьшенной на 1.

- Mean Square (Средний квадрат) – отношение суммы квадратов к числу степеней свободы.

- FF-критерий, отношение среднего квадрата между группами к среднему квадрату внутри группы.

- Sig. (Значимость) – вероятность того, что наблюдаемые различия случайны. Величина значимости р = 0,002 свидетельствует о статистически достоверных различиях.

Описательные статистики

На рис. 6 приведен фрагмент выводимых данных, сгенерированный программой после выполнения шага и относящийся к описательным статистикам.

Рис. 6. Фрагмент окна вывода после выполнения шага и относящийся к описательным статистикам.

Трактовка терминов, используемых программой в окне вывода, дана далее.

- N – число объектов для каждой из градаций переменной хобби.

- Mean (Среднее) – среднее значение переменной тест1 для каждой группы.

- Std. Deviation (Стд. отклонение) – мера разброса значений распределения относительно среднего.

- Std. Error (Стд. ошибка) – отношение стандартного отклонения к квадратному корню из числа объектов.

- 95% Confidence Interval for Mean (Доверительный интервал для среднего значения в 95 %) – при большом числе выборок из генеральной совокупности 95 % средних значений этих выборок попадут в интервал, определяемый указанными в таблице границами.

- Minimum (Минимум) – наименьшее из наблюдаемых значений для группы.

- Maximum (Максимум) – наибольшее из наблюдаемых значений для группы.

Апостериорные парные сравнения

На рис. 7 приведен фрагмент выводимых данных, сгенерированный программой после выполнения шага 5а и относящийся к парным сравнениям.

Рис. 7. Фрагмент окна вывода после выполнения шага 5а и относящийся к парным сравнениям

Средние значения переменной тест 1 для каждой их трех выборок были перечислены в предыдущей таблице (см. рис. 6), здесь же даны разности между этими значениями. Знаком звездочки помечены те пары выборок, для которых разность средних значений статистически достоверна, то есть со значением уровня значимости 0,05 и меньше. Из полученных данных можно сделать вывод, что результаты теста 1 для тех, кто увлекается компьютером, статистически значимо выше, чем для тех, кто увлекается спортом и искусством. Те же, кто увлекаются спортом и искусством, по результатам теста 1 статистически достоверно не различаются.

Критерий Ливиня

На рис. 8 фрагмент выводимых результатов, сгенерированный программой после выполнения шага 5б и относящийся к критерию однородности дисперсии Ливиня.

Рис. 8. Фрагмент окна вывода после выполнения шага 5б, относящийся к критерию Ливиня.

Критерий однородности дисперсии Ливиня со значимостью 0,161 показал, что дисперсии для каждой из групп статистически достоверно не различаются. Следовательно, результаты ANOVA могут быть признаны корректными. Если бы результат применения критерия Левина оказался статистически достоверным, то это послужило бы основанием для сомнения в корректности применения анализа ANOVA.

Контрасты

На рис. 9 приведены фрагменты выводимых результатов, сгенерированные программой после выполнения шага и относящиеся к применению метода контрастов.

Рис. 9. Фрагменты окна вывода после выполнения шага 5б, относящиеся к применению метода контрастов

Первая из таблиц, приведенных на рисунке, содержит коэффициенты, введенные при группировании уровней. Для каждого контраста было применено по два t-критерия, один из которых проводился с допущением о равных дисперсиях, а другой – с допущением о неравных дисперсиях. Первый контраст оказался статистически достоверным: те, кто увлекается компьютером, имеют статистически достоверно более высокий результат по переменной тест 1. Второй контраст не достигает статистически достоверного: учащиеся, увлекающиеся спортом, статистически достоверно не отличаются от других учащихся по переменной тест1. Ниже дана трактовка терминов, используемых программой в окне вывода.

- Value of Contrast (Величина контраста) – это значение не представляет интереса для исследователя, поскольку является всего лишь весовым коэффициентом.

- Std. Error (Стандартная ошибка) – отношение стандартного отклонения контраста к квадратному корню из числа объектов.

- t (t-критерий) отношение величины контраста к стандартной ошибке.

- df (ст. св.) величина, для равных дисперсий равная разности числа объектов и числа групп, уменьшенной на единицу. В случае неравных дисперсий число степеней свободы вычисляется по более сложной формуле и может быть дробным.

- Sig(2-tailed) (Двусторонняя значимость) – вероятность того, что отличие контраста от нуля является случайным.

2. Многофакторный дисперсионный анализ

Рассмотрим дисперсионный анализ (ANOVА) с двумя и более факторами. В нем участвует единственная зависимая переменная, которая, как и при однофакторном дисперсионном анализе, должна быть метрической. Главное отличие многофакторного от однофакторного заключается в том, что в нем участвуют не одна, а несколько независимых переменных, каждая из которых представлена в номинативной шкале (имеет несколько градаций, или уровней). Многофакторный дисперсионный анализ реализуется в SPSS с помощью команды General Linear Model – Univariate (Общие линейные модели – Одномерный анализ).

Многофакторный дисперсионный анализ отличается от однофакторного появлением одной общей проблемы – проблемы взаимодействия факторов. Решение этой проблемы принципиально не зависит от числа факторов. С возрастанием числа факторов существенно нарастает лишь сложность интерпретации взаимодействий. Поэтому мы подробно рассмотрим только самый распространенный вариант дисперсионного анализа с двумя факторами.

Рассмотрим двухфакторный дисперсионный анализ и анализ с учетом влияния ковариаты. Воспользуемся графическими средствами интерпретации средних значений, а также в конце проведем разбор результатов.

Дисперсионный анализ с двумя факторами

Дисперсионный анализ определяет статистическую достоверность различия между выборками путем их средних значений. Чтобы получить представление о двухфакторном анализе, сначала немного вернемся назад и обобщим наши знания об однофакторном дисперсионном анализе. Мы сравнивали три класса (переменная класс) по уровню выраженности переменной тест 1. «Однофакторность» анализа заключалась в том, что деление группы производилось по градациям (класс). Для однофакторного дисперсионного анализа в SPSS существует специальная упрощенная команда One-Way ANOVA (Однофакторный дисперсионный анализ). Команды подменю General Linear Model (Общие линейные модели) позволяют выполнять однофакторный, двухфакторный, трехфакторный и т. д. анализ, однако обращение с ними несколько сложнее.

Для проведения многофакторного дисперсионного анализа мы будем использовать файл ex0l .sav. В качестве зависимой переменной мы возьмем переменную отметка 2, а роль независимых будут играть переменные пол и хобби. Мы попытаемся определить степень влияния переменных пол, хобби и их взаимодействия пол x хобби на распределение значений переменной отметка 2. Такая схема анализа может быть обозначена как ANOVA 2 х З (пол х хобби). Исследование позволит получить ответы на перечисленные ниже вопросы.

- Существует ли главный эффект фактора пол, то есть существует ли значимое различие оценок для юношей и девушек, и какова степень этого различия?

- Существует ли главный эффект фактора хобби, то есть существует ли значимое различие между тремя группами и какова степень этого различия?

- Существует ли взаимодействие переменных пол и хобби, то есть зависит ли влияние одной из этих переменных от градаций другой?

Таким образом, двухфакторный дисперсионный анализ позволяет проверить три гипотезы: две о главном эффекте и одну о взаимодействии факторов. Ответы на два первых вопроса можно было бы получить, применив дважды однофакторный дисперсионный анализ. Специфика многофакторного анализа проявляется в содержании третьего вопроса, который касается взаимодействия факторов. Взаимодействие двух факторов означает, что влияние одного из них проявляется по-разному на разных уровнях другого фактора. Весьма полезным для интерпретации взаимодействий является построение диаграмм средних значений для каждой ячейки таблицы сопряженности независимых переменных. На диаграммах будут представлены все зависимости от их значимости, что позволяет более ясно представлять, почему воздействие одних переменных оказывается значимым, а других – нет. Более детально проблема взаимодействия будет рассмотрена на примере при обсуждении результатов.

SPSS может включить в вывод значения всех выборок, соответствующих всем возможным сочетаниям градаций факторов (в данном случае 2 х 3 = 6), а также вычислить F-величины и соответствующие p-уровни. По этим характеристикам мы сможем судить о каждой из независимых переменных на распределение зависимой переменной и о взаимодействии независимых переменных.

Дисперсионный анализ с тремя и более факторами

Как уже отмечалось, проведение дисперсионного анализа с тремя и более факторами принципиально не отличается от двухфакторного анализа. При количестве факторов более двух возрастает лишь сложность интерпретации взаимодействий факторов. Эта сложность обусловлена появлением большого числа взаимодействий, некоторые из которых с трудом поддаются интерпретации. Рассмотрим эту проблему па примере.

Предположим, изучается влияние па переменную отметка 2 трех факторов: пол, хобби и класс. Такая схема может быть как (пол х хобби х класс). Применение трехфакторного дисперсионного анализа позволило бы получить ответы на следующие вопросы:

- Существует ли главный эффект фактора пол, то есть существует ли значимое различие оценок для юношей и девушек, и какова степень этого различия?

- Существует ли главный эффект фактора хобби, то есть существует ли значимое различие оценок между тремя группами, и какова степень этого различия?

- Существует ли главный эффект фактора класс, то есть существует ли значимое различие оценок между классами, и какова степень этого различия?

- Существует ли взаимодействие переменных пол и хобби, то есть зависит ли влияние одной из этих переменных от градаций другой?

- Существует ли взаимодействие переменных пол и класс, то есть зависит ли влияние одной из этих переменных от градаций другой?

- Существует ли взаимодействие переменных класс и хобби, то есть зависит ли влияние одной из этих переменных от градаций другой?

- Существует ли взаимодействие переменных пол, хобби и класс, то есть зависит ли взаимодействие двух из этих переменных от градаций третьей?

Таким образом, трехфакторный дисперсионный анализ предполагает проверку уже семи гипотез. Из них три гипотезы касаются взаимодействия первого порядка (двух факторов) и одна – взаимодействия второго порядка (трех факторов). Если добавить еще один, четвертый фактор, то появится взаимодействие третьего порядка, а число проверяемых гипотез возрастет до 15. Для пяти факторов число проверяемых гипотез составит уже 31! Общее число проверяемых гипотез равно 2Р - 1, где Р – число факторов.

При увеличении числа факторов быстро возрастает не только количество проверяемых гипотез, но и сложность интерпретации взаимодействий. Если, как мы увидим далее, интерпретация взаимодействия первого порядка (двух факторов) обычно не составляет труда, то взаимодействие второго порядка обязательно требует построения графиков средних значений, а интерпретация взаимодействия третьего порядка и выше вряд ли вообще возможна.

Влияние ковариат

Ковариаты используются для исключения влияния количественной переменной на зависимую переменную. Ковариату проще всего представить как переменную, значительно коррелирующую с зависимой переменной и позволяющую уменьшить дисперсию последней. Включение в анализ ковариаты по смыслу означает исключение ее влияния на зависимую переменную. За счет этого дисперсия последней уменьшается, что позволяет сделать более очевидным влияние факторов.

В нашем исследовании в качестве ковариаты будет использоваться переменная тест 5 (кратковременная память). Эта переменная, как суммарный показатель интеллектуальных способностей, в существенной степени коррелирует с успеваемостью (отметка 2). Если мы хотим проследить влияние факторов пол и хобби на зависимую переменную отметка 2 без учета влияния фактора тест 5, то последний необходимо включить в анализ в качестве ковариаты. Появление ковариаты не влияет на описательные статистики, однако может изменить сумму квадратов (как правило, в меньшую сторону) и величину F-критерия (как в меньшую, так и, возможно, в большую сторону).

Пошаговые алгоритмы вычислений

Для проведения многофакторного дисперсионного анализа сначала необходимо выполнить три подготовительных шага. Эти шаги (шаг 1 – шаг 3) позволят подготовить рабочий файл данных, запустить программу SPSS for Windows 15.0 и открыть файл ex01.sav.

После завершения шага 3 на экране должно присутствовать окно редактора данных со строкой меню и загруженным файлом ex01.sav.

Шаг 4. В меню Analyze (Анализ) выберите команду General Linear Models Univariate (Общие линейные модели ► Одномерный анализ). На экране появится диалоговое окно Univariate (Одномерный анализ), показанное на рис. 10.

Рис. 10. Диалоговое окно Univariate

Как вы, вероятно, обратили внимание, в меню General Linear Model (Общие линейные модели), помимо команды Univariate (Одномерный анализ), находятся еще три команды: Multivariate (Многомерный анализ), Repeated Measures (Повторные измерения) и Variance Components (Компоненты дисперсии). Команда Multivariate (Многомерный анализ) используется для многомерного дисперсионного и ковариационного анализов и будут рассмотрены далее. Команда Repeated Measures (Повторные измерения) может применяться как для однофакторного, так и для многофакторного анализов. Команда Variance Components (Компоненты дисперсии) обладает несколько большей гибкостью по сравнению с предыдущими.

В левой части диалогового окна Univariate (Одномерный анализ) расположен список всех доступных переменных файла данных, а справа находятся 5 полей, с помощью которых задаются основные параметры дисперсионного анализа. Поле Dependent Variable (Зависимая переменная) предназначено для указания единственной зависимой переменной анализа, поле Fixed factor(s) (Постоянные факторы) – для имен независимых переменных, или факторов, поле Covariate(s) (Ковариаты) – для указания имен ковариат. Кнопки Contrasts (Контрасты) и Post Hoc (Постфактум) действуют практически идентично своим аналогам из диалогового окна One-Way ANOVA (Однофакторный дисперсионный анализ).

Особое значение имеет кнопка Plots (Диаграммы), позволяющая строить графики средних значений. Для построения графиков в программе SPSS предусмотрено отдельное меню Graphs (Графики), но в связи с тем, что графики средних значений совершенно необходимы для интерпретации взаимодействий факторов, в основные диалоговые окна команд подменю General Linear Model (Общие линейные модели) включена кнопка Plots (Диаграммы), позволяющая строить эти графики, не выходя из диалогового окна настройки параметров анализа.

Двухфакторный дисперсионный анализ

После задания зависимой переменной отметка 2 необходимо задать независимые переменные, по очереди помещая их в поле Fixed factor(s) (Постоянные факторы).

Когда имена всех переменных участвующих в анализе определены, можно перейти к заданию параметров выполняемых действий. Для этого щелкните на кнопке Options (Параметры). На экране появится диалоговое окно Univariate: Options (Одномерный анализ: Параметры), представленное на рис. 11. Нас будет интересовать группа флажков Display (Отображать), позволяющая задать список включаемых в вывод величин. Так, флажок Descriptive statistics (Описательные статистики) позволяет вывести для каждой ячейки таблицы сопряженности градаций факторов средние значения, стандартные отклонения и размеры выборок. Нередко используется флажок Estimates of effect size (Оценка величины эффекта), включающий в выводимые данные величину эффекта(X2), предназначенную для оценки влияния  каждой из независимых переменных, а также их взаимодействий.

Рис. 11. Диалоговое окно Univariate: Options

Следующий пример представляет собой практическую реализацию описанных действий.

Шаг 5. После выполнения шага 4 должно быть открыто диалоговое окно Univariate (Одномерный анализ), показанное на рис. 10.

1. Щелкните сначала на переменной отметка 2, чтобы выделить ее, а затем на верхней кнопке со стрелкой, чтобы переместить переменную в поле Dependent Variable (Зависимая переменная).

2. Щелкните сначала на переменной пол, чтобы выделить ее, а затем на второй сверху кнопке со стрелкой, чтобы переместить переменную в список Fixed Factor(s) (Постоянные факторы).

3. Повторите предыдущее действие для переменной хобби.

4. Щелкните на кнопке Options (Параметры), чтобы открыть диалоговое окно Univariate: Options (Одномерный анализ: Параметры).

5. Установите флажки Descriptive statistics (Описательные статистики) и Estimates of effect size (Оценка величины эффекта), а затем щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Univariate (Одномерный анализ).

6. Щелкните на кнопке OK, чтобы открыть окно вывода.

Влияние ковариаты

В следующем пошаговом алгоритме мы реализуем двухфакторный дисперсионный анализ с учетом ковариаты. Все переменные останутся теми же, но дополнительно в качестве ковариаты включим переменную тест 5. Это позволит сравнить результаты дисперсионного анализа с учетом и без учета влияния ковариаты.

Шаг 5а. После выполнения шага 4 должно быть открыто диалоговое окно Univariate (Одномерный анализ), показанное на рис. 10. Если вы уже успели поработать с этим окном, щелкните на кнопке Reset (Сброс).

1. Щелкните сначала на переменной отметка 2, чтобы выделить ее, а затем на верхней кнопке со стрелкой, чтобы переместить переменную в поле Dependent Variable (Зависимая переменная).

2. Щелкните сначала на переменной пол, чтобы выделить ее, а затем на второй сверху кнопке со стрелкой, чтобы переместить переменную в список Fixed Factor(s) (Постоянные факторы).

3. Повторите предыдущее действие для переменной хобби.

4. Щелкните сначала на переменной тест 5, чтобы выделить ее, а затем на второй снизу кнопке со стрелкой, чтобы переместить переменную в список Covariates (Ковариаты).

5. Щелкните па кнопке Options (Параметры), чтобы открыть диалоговое окно Univariate: Options (Одномерный анализ: Параметры).

6. Установите флажки Descriptive statistics (Описательные статистики) и Estimates of effect size (Оценка величины эффекта), а затем щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Univariate (Одномерный анализ).

7. Щелкните на кнопке ОК, чтобы открыть окно вывода.

Результаты выполнения шага 5а будут отличаться от результатов выполнения шага 5 только учетом ковариаты, роль которой играет переменная тест 5.

Графические средства интерпретации взаимодействий

В большинстве случаев для интерпретации взаимодействия факторов необходимо построение графиков средних значений. Для этого служит кнопка Graphs (Графики), открывающая диалоговое окно Univariate: Profile Plots (Одномерный анализ: Диаграммы профилей), показанное па рис. 12. В этом окне можно задать параметры сразу нескольких графиков средних значений. Каждый график представляет собой ломаную линию (профиль), соединяющую точки – средние значения для групп. Горизонтальной оси соответствуют градации одного из факторов, а величина средних значений откладывается по вертикальной оси.

Рис. 12. Диалоговое окно Univariate: Profile Plots

Вид графиков задается тремя параметрами. В поле Horisontal Axis (Горизонтальная ось) вводится имя фактора, градациям которого будет соответствовать горизонтальная ось графика или графиков. В поле Separate Lines (Отдельные линии) указывается фактор, градациям которого будут соответствовать разные линии на графике. Поле Separate Plots (Отдельные диаграммы) служит для задания имени фактора, градациям которого будут соответствовать разные графики. Щелчок на кнопке Add (Добавление) подтверждает правильность введенных параметров и позволяет перейти к заданию графиков другого типа.

При проведении двухфакторного дисперсионного анализа, как в нашем примере, достаточно построить один график. Для этого надо задать сначала имя фактора для горизонтальной оси (Horisontal Axis). Обычно это тот фактор, который имеет больше градаций, – в нашем случае это фактор хобби. Затем необходимо задать имя фактора для отдельных линий графике (Separate Lines), – в нашем случае это фактор пол. В результате будет построен график с двумя ломаными линиями, каждая из которых соединяет три точки. Вертикальная ось этого графика будет соответствовать величине средних значений, горизонтальная ось – переменной хобби, а две отдельные линии – переменной пол.

Для трехфакторного анализа подобный график позволит интерпретировать только двухфакторное взаимодействие. Для интерпретации трехфакторного взаимодействия необходимо градациям третьего фактора поставить в соответствие разные диаграммы (Separate Plots). Например, если бы третьим фактором в нашем примере был фактор класс, то задание этого фактора как имени для разных графиков привело бы к построению трех графиков – по одному для каждого класса, каждый из которых соответствовал бы двухфакторному взаимодействию переменных пол и хобби.

Пошаговый алгоритм, приведенный ниже, повторяет действия предшествующего шага, но добавляет в окно вывода график средних значений, позволяющий интерпретировать взаимодействие факторов пол и класс.

Шаг 5б. После выполнения шага 4 должно быть открыто диалоговое окно Univariate (Одномерный анализ), показанное на рис. 10. Если вы уже успели поработать с этим окном, щелкните на кнопке Reset (Сброс).

1. Задайте переменные для анализа. Для этого щелкните на переменной отметка 2, чтобы выделить ее, а затем на верхней кнопке со стрелкой, чтобы переместить переменную в поле Dependent Variable (Зависимая переменная); щелкните на переменной пол, чтобы выделить ее, а затем на второй сверху кнопке со стрелкой, чтобы переместить переменную в список Fixed Factor(s) (Постоянные факторы). Повторите то же действие для переменной хобби. Щелкните па переменной тест 5, чтобы выделить ее, а затем на второй снизу кнопке со стрелкой, чтобы переместить переменную в список Covariates (Ковариаты).

2. Задайте параметры результатов. Для этого щелкните па кнопке Options (Параметры), чтобы открыть диалоговое окно Univariate: Options (Одномерный анализ: Параметры), и установите флажки Descriptive statistics (Описательные статистики) и Estimates of effect size (Оценка величины эффекта), а затем щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Univariate (Одномерный анализ).

3. Щелкните на кнопке Graphs (Графики), чтобы открыть диалоговое окно Univariate: Profile Plots (Одномерный анализ: Диаграммы профилей).

4. Выделите в списке Factors (Факторы) переменную хобби и щелчком на верхней кнопке со стрелкой перенесите ее в поле Horisontal Axis (Горизонтальная ось).

5. Выделите в списке Factors (Факторы) переменную пол и щелчком на второй сверху кнопке со стрелкой перенесите ее в поле Separate Lines (Отдельные линии).

6. Подтвердите правильность введенных параметров щелчком на кнопке Add (Добавление) – в нижнем поле появится строка хобби*пол, обозначающая тип графика средних.

7. Щелкните па кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Univariate (Одномерный анализ).

8.Щелкните на кнопке ОК, чтобы открыть окно вывода.

После выполнения шага 5 программа автоматически активизирует окно вывода. Для просмотра результатов при необходимости можно воспользоваться вертикальной и горизонтальной полосами прокрутки. Обратите внимание на стандартную строку меню в верхней части окна вывода: ее присутствие позволяет выполнять любые статистические операции, переключаясь обратно в окно редактора данных.

Печать результатов и выход из программы

Ниже описана типичная процедура печати результатов статистического анализа (или анализов). После выполнения шага 5 должно быть открыто окно вывода.

Шаг 6. В окне вывода укажите фрагменты, выводимые на печать, в меню File (Файл) выберите команду Print (Печать), при необходимости задайте параметры печати и щелкните на кнопке ОК. Последнее, что необходимо сделать после завершения исследования и печати результатов, – это выйти из программы SPSS.

Шаг 7. Для выхода из программы в меню File (Файл) выберите команду Exit (Выход).

Иногда после выполнения команды Exit (Выход) на экране могут появляться небольшие диалоговые окна с вопросом о необходимости сохранения сделанных в файлах изменений и кнопками, описывающими возможные варианты ответа. Для завершения работы просто щелкайте на соответствующих кнопках.

Представление результатов

Двухфакторный дисперсионный анализ

На рис. 13 приведены фрагменты выводимых данных, сгенерированных программой после выполнения шага 5.

Рис. 13. Фрагменты окна вывода после выполнения шага 5

В таблице Descriptive Statistics (Описательные статистики) содержатся характеристики всех выборок, образованных каждой из независимых переменных в отдельности (2 выборки по признаку пола и 3 выборки по переменной хобби), а также при пересечении градаций независимых переменных (3x2 = 6 выборок). Таблица Tests of Between-Subjects Effects (Критерии для межгрупповых эффектов) содержит результаты проверки трех основных гипотез двухфакторного дисперсионного анализа.

- Переменная пол оказывает статистически достоверное влияние на распределение зависимой переменной отметка 2 (средние значения для юношей и девушек составили соответственно 4,13 и 4,28, F = 4,74, р = 0,032).

- Переменная хобби не оказывает статистически значимого влияния па распределение зависимой переменной отметка 2 (средние значения для групп 1, 2 и 3 составили, соответственно, 4,10, 4,26 и 4,31, F = 2,74, р = 0,070).

- Не обнаружено статистически достоверного взаимодействия между независимыми переменными пол и хобби 2,28, р = 0,108).

Влияние ковариаты

На рис. 14 приведен фрагмент выводимых данных, сгенерированных программой после выполнения шага 5а.

Рис. 14. Фрагмент окна вывода после выполнения шага 5а

Включение ковариаты не меняет описательные статистики, но вносит некоторые изменения в результаты проверки гипотез дисперсионного анализа, как видно из таблицы Tests of Between-Subjects Effects (Критерии для межгрупповых эффектов).

Ковариата оказывает влияние па суммы квадратов и, как следствие, на число степеней свободы (в некоторых случаях), средние квадраты, величины F и частной Эта в квадрате (η2), а также значения p-уровней. Если это влияние существенно, то, как правило, значения среднего квадрата и F-критерия увеличиваются, а соответствующие значения p-уровней значимости уменьшаются.

Обратите внимание, что ковариата тест 5 оказывает значительное влияние па разброс зависимой переменной отметка 2: значение η2 составляет 0,079, то есть 7,9 % дисперсии переменной отметка 2 обусловлено влиянием ковариаты. Дисперсия скорректированной модели представляет собой сумму всех сумм квадратов дисперсий, обусловленных влияниями независимых переменных и их взаимодействий.

Сравните между собой результаты дисперсионного анализа с ковариатой и без ковариаты. Благодаря тому, что ковариата «съедает» часть дисперсии зависимой переменной, для взаимодействия факторов F-критерий увеличивается, а р-уровень уменьшается. В результате взаимодействие факторов становится статистически достоверным. Разумеется, подобный результат проявляется не всегда, и вы можете убедиться в этом на примере строк пол и хобби: в них введение ковариаты уменьшило F-критерии и увеличило p-уровни. В итоге снизилась статистическая значимость эффекта фактора пол.

Таким образом, двухфакторный дисперсионный анализ с зависимой переменной отметка 2, независимыми переменными пол и хобби и ковариатой тест 5 дал следующие результаты:

- Ковариата тест 5 оказывает статистически достоверное влияние на зависимую переменную отметка 2 (F =7,964, р = 0,006).

- Переменная пол оказывает влияние на распределение зависимой переменной отметка 2 лишь на уровне статистической тенденции (F = 3,035, р =0,085).

- Переменная хобби не оказывает статистически значимое влияние на распределение зависимой переменной отметка2 (F=3,441, р = 0,036).

- Обнаружение статистически достоверное взаимодействие между независимыми переменными пол и хобби (F = 3,321, р = 0,040).

Отметим, что не очень удобно интерпретировать взаимодействие факторов по средним значениям из таблицы Descriptive Statistics (Описательные статистики). Для этого лучше использовать графики средних значений, полученные после выполнения шага 5б.

Использование графиков для интерпретации взаимодействия

На рис. 15 приведен график средних значений, который генерируется программой после выполнения шага 5б.

Рис. 15. График средних значений, генерируемый после выполнения шага 5б

График позволяет без труда интерпретировать взаимодействие факторов: влияние фактора хобби на переменную отметка 2 проявляется по-разному на разных градациях переменной пол. Так, средний балл отметок для девушек примерно одинаков вне зависимости от внешкольных увлечений. Для юношей средний балл отметок значительно различается в зависимости от внешкольных увлечений: наиболее высокий средний балл имеют школьники, которые увлекаются компьютером.

Взаимодействие факторов на графике выглядит как заметное различие формы профилей соответствующих линий. Чем ближе по форме профили линий, тем меньше взаимодействие факторов. Но интерпретации подлежат только те графики, которые соответствуют статистически достоверному взаимодействию факторов.

Если бы проводился трехфакторный анализ, то интерпретация трехфакторного взаимодействия требовала бы построения нескольких графиков. Так, при добавлении фактора класс потребовалось бы построение трех графиков взаимодействия: по одному для каждой градации фактора класс. Попробуйте самостоятельно провести трехфакторный дисперсионный анализ, добавив при выполнении инструкций шага переменную класс в качестве третьего фактора и при задании параметров графиков средних значений в диалоговом окне Univariate: Profile Plots (Одномерный анализ: Диаграммы профилей) указав эту переменную в поле Separate Plots (Отдельные диаграммы).

Терминология, используемая при выводе

Ниже дана трактовка терминов, используемых программой в окне вывода.

- Sum of squares (Сумма квадратов) – сумма квадратов отклонений от среднего значения. Различают несколько видов сумм квадратов. Скорректированная сумма квадратов модели (Corrected Model) учитывает отклонения, обусловленные независимыми переменными и их взаимодействием, а скорректированная полная сумма квадратов (Corrected Total) характеризует всю дисперсию распределения. Каждому фактору и их взаимодействию соответствует своя величина суммы квадратов. Остаточная сумма квадратов (Error) учитывает ту часть, которая обусловлена влияниями со стороны независимых переменных или их взаимодействий.

- df – число степеней свободы. Для ковариаты это число равно 1, для факторов – числу уровней фактора, уменьшенному на 1,для переменной хобби - 2 (то есть 3 - 1), для переменной пол – 1 (то есть 2 - 1). Для двух взаимодействующих факторов это число равно произведению степеней свободы факторов: для факторов хобби х пол оно равно 2 (то есть 2 х 1). Число степеней свободы скорректированной модели равно сумме степеней свободы независимых переменных и их взаимодействия (1 + 1 + 2 + 2 = 6). Число степеней свободы ошибки (остатка) равно разности числа объектов и числа степеней свободы скорректированной модели, уменьшенной на единицу (100 - 6 - 1 = 93). Скорректированное суммарное число степеней свободы равно числу объектов, уменьшенному на единицу (100 - 1 = 99).

- Mean square (Средний квадрат) – отношение суммы квадратов к числу степей свободы.

F (F-критерий) – отношение среднего квадрата независимой переменной или взаимодействия переменных к среднему квадрату ошибки (остатка).

- Sig. (Значимость) – вероятность того, что различие (влияние) является случайным.

- Partial Eta Squared (Частичный квадрат эта) — оценка величины эффекта (η2). Под эффектом понимается вклад независимой переменной или взаимодействия переменных в разброс зависимой переменной.

3. Многомерный дисперсионный анализ

Рассмотрим методы обработки данных, которые содержат несколько зависимых переменных: многомерный дисперсионный анализ (Multivariate Analysis OfVariances, MANOVA) и многомерный ковариационный анализ (Multivariate Analysis Of Covariance, MANCOVA). Команды многомерного анализа, входящие в подменю General Linear Model (Общая линейная модель), относятся к наиболее сложным командам в SPSS. Для выполнения многомерного анализа требуется полная установка пакета SPSS, включая модули Advanced Models (Дополнительные модели) и Regression Models (Регрессионные модели). Помимо команды: Multivariate (Многомерный анализ), предназначенной для проведения анализов MANOVA и MANCOVA,. к командам многомерного анализа относится и команда Repeated Measures (Повторные измерения), позволяющая провести анализ MANOVA с повторными измерениями.

Ввиду значительной сложности мы              упоминаем лишь наиболее понятные и широко используемые параметры команды Multivariate (Многомерный анализ). Фактически критерии MANOVA и MAVCOVA являются расширением дисперсионного анализа (ANOVA), рассмотренного ранее.

Как упоминалось выше, t-критерий для двух выборок позволяет выяснить, существуют ли различия между двумя средними значениями для этих выборок. Эту простейшую ситуацию (единственная независимая переменная с двумя градациями и одна зависимая переменная метрического типа) можно последовательно усложнить тремя способами:

- ввести в рассмотрение независимую переменную с более чем двумя градациями – в такой ситуации применяется однофакторный дисперсионный анализ;

- ввести не одну, а несколько независимых переменных – для этого предназначен многофакторный дисперсионный анализ;

- задействовать ковариаты.

Во всех трех случаях зависимая переменная остается единственной и имеет метрический тип. Тем не менее существуют задачи, в которых требуется учитывать не одну, а несколько зависимых переменных. В этой главе мы займемся рассмотрением проблемы проведения анализа с участием более чем одной зависимой переменной; при этом мы не станем усложнять требовании к независимым переменным.

Обратимся к файлу данных ex0l .sav. Представим себе, что нам необходимо сравнить мужчин и женщин (переменная пол) одновременно по всем пяти показателям теста (переменные тест1, ..., тест5). В подобной ситуации одним из возможных подходов является пятикратное применение t-критерия или однофакторного дисперсионного анализа (эти методы эквивалентны, поскольку t2 = F). Очевидным достоинством такого решения является простота и ясность, однако нельзя не заметить и двух недостатков: во-первых, при неоднократном применении статистического критерия (в данном случае пятикратном) увеличивается вероятность ошибки, то есть вероятность случайности общего результата исследования; во-вторых, если между зависимыми переменными имеется некоторая корреляция (а в рассматриваемом случае есть), то результат, полученный в отношении каждой из этих переменных в отдельности, не способен отразить этот важный факт.

Описанные недостатки привели к усовершенствованию как t-критерия, так и дисперсионного анализа: первый был расширен с помощью критерия Хотеллинга (Hotelling), а вместо второго стал использоваться многомерный дисперсионный анализ (MANOVA). Оба типа анализа реализуются командой Multivariate (Многомерный анализ). Кроме того, эта команда позволяет проводить многомерный анализ учитывающий влияние ковариат. Особенностью всех типов многомерного анализа является то, что обрабатывают все зависимые переменные одновременно. В примерах будет показано, каким образом исследовать структуру изменений зависимых переменных путем применения серий одномерных F-критериев или серий множественных сравнений постфактум.

Применяя MANOVA в отношении множества зависимых переменных, следует помнить, что линейная функциональная связь между ними недопустима. Иными словами, следует избегать применения анализа MANOVA к тем зависимым переменным, корреляция между которыми близка к 1.

Как и в случае одномерного дисперсионного анализа, в MANOVA для определения значимости различий между группами используются F-критерий. Отметим, что многомерный дисперсионный анализ, как и одномерный, позволяет оценить влияния не только отдельных независимых переменных (главных эффектов), но и их взаимодействий. Поскольку мы рассматриваем наличие нескольких зависимых переменных, F-статистика носит многомерный характер, и для ее формиро­вания используется матричная алгебра.

Для иллюстрации многомерного дисперсионного анализа используется файл данных ex02.sav. Этот файл содержит гипотетические результаты эксперимента по изучению эффективности запоминания слов в зависимости от частоты их встречаемости и от интонации, с которой они предъявлялись (зачитывались). Ряды из 24 не связанных по смыслу слов одинаковой длины зачитывались 20 испытуемым. Сразу после предъявления испытуемых просили воспроизвести эти слова. Подсчитывалось количество правильно воспроизведенных слов из начала ряда – первых 8 слов (переменная начало1), из середины ряда (переменная средн 1) и из конца ряда – завершающих 8 слов (переменная конец1). Переменная инт соответствует делению на две группы: первой (инт = 1) все слова читались с одинаковой интонацией; второй (инт = 2) середина ряда интонационно выделялась. Переменной част соответствует деление испытуемых на тех, кому предъявлялся ряд часто встречающихся слов (част = 1), и тех, кому предъявлялся ряд редко встречающихся слов (част = 2). Кроме того, каждый предъявляемый ряд составлялся из слов одинаковой эмоциональной значимости – ряды различались и по этой переменной (знач – количественная переменная, отражающая эмоциональную значимость). Таким образом, данные позволяют проверить гипотезы о двух независимых переменных (инт – интонация, част – частота) на три зависимые переменные (начало1, средн1, конец1). Переменная знач используется как ковариата, иными словами, ее влияние при проверке указанных гипотез будет исключено.

Для многомерного анализа необходимо иметь как минимум две зависимые переменные (иначе анализ не является многомерным) и как минимум одну независимую переменную. Теоретически количество зависимых и независимых переменных не ограниченно, однако на практике объем выборки диктует необходимость существенного ограничения их числа. Использование ковариат, разумеется, не является обязательным.

Пошаговые алгоритмы вычислений

При проведении многомерного дисперсионного анализа сначала необходимо выполнить три подготовительных шага. Эти шаги (шаг 1 – шаг 3) позволят подготовить рабочий файл данных, запустить программу SPSS for Windows 15.0 и открыть файл ex02.sav.

После завершения шага 3 на экране должно присутствовать окно редактора данных со строкой меню и загруженным файлом ex02.sav.

Шаг 4. В меню Analyze (Анализ) выберите команду General Linear Model – Multivariate (Общая линейная модель – Многомерный анализ). Откроется диалоговое окно Multivariate (Многомерный анализ), показанное на рис. 16.

Рис. 16. Диалоговое окно Multivariate

Окно Multivariate (Многомерный анализ) позволяет задавать переменные для многомерного анализа, а также управлять диалоговыми окнами, предназначенными для определения параметров анализа. Те переменные, которые будут использоваться в качестве зависимых, необходимо поместить в список Dependent Variables (Зависимые переменные), а независимые переменные – в список Fixed Factor(s) (Постоянные факторы).

Как и прежде, для перемещения переменных из исходного списка в целевой используется одна из кнопок со стрелками. Мы будем использовать в наших примерах анализа 3 зависимые и 2 независимые переменные из файла ex02.sav. При желании в анализ могут быть введены одна или несколько ковариат с помощью списка Covariate(s) (Ковариаты).

В правой части диалогового окна расположены 6 кнопок, предназначенные для настройки Contrasts (Контрасты) и Save (Сохранить) не рассматривается, поскольку настройка соответствующих параметров требует очень высокой квалификации исследователя.

В большинстве случаев требуется многомерный анализ как для каждой из независимых переменных, так и для всех вариантов их взаимодействий (полнофакторная модель). Полнофакторная модель является моделью анализа, используемой по умолчанию. С другой стороны, иногда полезно исключить из рассмотрения часть взаимодействий или отдельные переменные. Для управления моделью анализа используется кнопка Model в диалоговом окне Multivariate (Многомерный анализ). При щелчке на ней открывается диалоговое окно Multivariate: Model (Многомерный анализ: Модель), представленное на рис. 17.

Рис. 17. Диалоговое окно Multivariate: Model

По умолчанию в группе Specify Model (Выбор модели) установлен переключатель Full factorial (Полнофакторная модель), однако вы можете установить переключатель Custom (Настройка), а затем с помощью кнопки с направленной вправо стрелкой переместить в список Model (Модель) только те переменные из списка Factors & Covariates (Факторы и ковариаты), которые вы хотите использовать.

Диалоговое окно Multivariate: Model (Многомерный анализ: Модель) с помощью списка Sum of squares (Сумма квадратов) позволяет также задать вариант расчета суммы квадратов. По умолчанию выбран вариант Type III (Тип III), подходящий для большинства ситуаций. Если исходные данные содержат пропущенные значения, иногда выбирают пункт Туре IV (Тип IV).

При интерпретации результатов многомерного анализа зачастую удобно иметь перед глазами графическое представление средних значений зависимых переменных, определяемых градаций независимых переменных (факторов). Для построения подобных графиков используется кнопка Plots (Диаграммы), назначение которой идентично назначению одноименной кнопки в окне Univariate (Одномерный анализ), используемом при проведении одномерного дисперсионного анализа. При щелчке на ней открывается диалоговое окно Multivariate: Profile Plots (Многомерный анализ: Диаграммы профилей), представленное на рис. 18.

Рис. 18. Диалоговое окно Multivariate: Profile Plots

Данное окно позволяет определить, каким образом отображать тот или иной фактор. Для каждой зависимой переменной в выводимые данные включаются отдельные графики. Обратите внимание, что при выполнении анализа с участием ковариат вместо фактических данных отображаются приближения средних значений, учитывающие наличие ковариат. В подобных случаях может быть полезным получение изображений без использования ковариат.

В левой части окна Multivariate: Profile Plots (Многомерный анализ: Диаграммы профилей) находится список Factors (Факторы), содержащий те независимые факторы, которые присутствуют в модели анализа. Окно содержит три поля: Horizontal Axis (Горизонтальная ось), Separate Lines (Отдельные линии) и Separate Plots (Отдельные диаграммы). В этих полях можно указать соответственно фактор, категории которого должны отображаться по горизонтальной оси, фактор, который должен отображаться в виде отдельных линий (по одной линии для каждой категории), и фактор, для каждого уровня которого должна строиться отдельная диаграмма.

Из перечисленных полей обязательным для заполнения является только поле Horizontal Axis (Горизонтальная ось), а чтобы ввести переменную в поле Separate Plots (Отдельные диаграммы), необходимо сначала заполнить поле Separate Lines (Отдельные линии). После заполнения этих полей щелкните па кнопке Add (Добавление). Соответствующая информация появится в списке в нижней части диалогового окна. Когда все параметры графика будут заданы, щелкните на кнопке Continue (Продолжить), чтобы вернуться в основное диалоговое окно.

Графическая интерпретация весьма полезна для оценки влияния независимых переменных и их взаимодействий. Для более детального анализа требуются множественные (парные) сравнения постфактум. Множественные сравнения проводятся в случае установления статистически достоверного влияния переменной и позволяют определять, между какими именно градациями независимой переменной имеются различия. Подобные сравнения проводятся для каждой из зависимых переменных и каждого выбранного фактора. Множественные сравнения неприменимы при использовании ковариат.

Для проведения парных сравнений применяется кнопка Post Hoc (Постфактум). При щелчке на ней открывается диалоговое окно Multivariate: Post Hoc Multiple Comparisons for Observed Means (Многомерный анализ: Множественные сравнения средних значений постфактум), представленное на рис. 19. Это окно идентично диалоговому окну One-Way ANOVA: Post Hoc Multiple Comparisons (Однофакторный дисперсионный анализ: Множественные сравнения постфактум). Отличается окно для многомерного анализа только наличием списков Factor(s) (Факторы) и Post Hoc Tests for (Критерии постфактум для). В список Post Hoc Tests for (Критерии постфактум для) следует включить факторы, для которых будут проводиться сравнения. Все доступные факторы перечислены в списке Factor(s) (Факторы).

Рис. 19. Диалоговое окно Multivariate: Post Hoc Multiple Comparisons for Observed Means

При щелчке на кнопке Options (Параметры) открывается диалоговое окно Multivariate: Options (Многомерный анализ: Параметры), представленное на рис. 20. По умолчанию все флажки в этом окне сброшены.

Если выделить нужные пункты в списке Factor(s) and Factor Interactions (Факторы и взаимодействия факторов) и переместить их в список Display Means For (Отображать средние для), то в выводимые данные будут включены средние значения каждой из зависимых переменных для всех уровней соответствующих факторов. Если анализ проводится без ковариат, включаемые средние значения будут фактическими средними данными; в противном случае средние значения будут подсчитаны с учетом влияния ковариат. Пункт (Overall) (Все) в списке Factor(s) and Factor Interactions (Факторы и взаимодействия факторов) позволяет вычислить срединие значения для всех ячеек. Если установить флажок Compare main effects (Сравнивать главные эффекты), будет проведена серия парных сравнении постфактум средних значений ячеек для каждого из факторов. Можно использовать либо критерий Бонферрони (Bonferroni), либо более «консервативный» критерий Сидака (Sidak). Другие критерии задаются при помощи описанного ранее диалогового окна Multivariate: Post Hoc Multiple Comparisons for Observed Means (Многомерный анализ: Множественные сравнения постфактум наблюдаемых средних значений) при условии, что анализ проводится без ковариат.

Рис. 20. Диалоговое окно Multivariate: Options

Мы опустим описания большей части флажков и упомянем лишь те, которые используются наиболее часто.

- Descriptive Statistics (Описательные статистики) – вычисляются средние значения и стандартные отклонения каждой зависимой переменной для каждой ячейки.

- Estimates of effect size (Оценки величины эффекта) – вычисляется значение η2, характеризующее величину воздействия фактора на зависимую переменную и показывающее, какая доля общей дисперсии обусловлена данным фактором.

- Parameter estimates (Оценки параметров) – вычисляются приближения и соответствующие значимости для всех факторов и ковариат модели. Это особенно удобно в случаях, когда в модель включена хотя бы одна ковариата.

- Homogeneity tests (Критерии однородности) – дисперсии для всех ячеек проверяются на равенство (однородность).

Поле Significance level (Уровень значимости) позволяет задать величину α для анализа. По умолчанию задан критический уровень значимости 0,05; если вы измените это значение, SPSS пересчитает соответствующие доверительные интервалы.

В рассматриваемом далее примере проводится многомерный дисперсионный анализ (MANOVA) с тремя зависимыми переменными начало1, средн1, конец1 и двумя независимыми переменными (факторами) инт и част.

Шаг 5. После выполнения предыдущего шага у вас должно быть открыто диалоговое окно Multivariate (Многомерный анализ), показанное на рис. 16. Если вы уже успели поработать с этим окном, щелкните на кнопке Reset (Сброс).

1. Щелкните на переменной начало1, нажмите клавишу Shift и, не отпуская ее, щелкните на переменной конец 1. В результате окажутся выделенными начало1, средн1, конец1.

2. Щелкните на верхней кнопке со стрелкой, чтобы переместить выделенные переменные в список Dependent Variables (Зависимые переменные).

3. Щелкните сначала на переменной инт, чтобы выделить ее, а затем на второй сверху кнопке со стрелкой, чтобы переместить переменную в список Fixed Factor(s) (Постоянные факторы).

4. Повторите предыдущее действие для переменной част.

5. Щелкните на кнопке ОК, чтобы открыть окно вывода.

В следующем примере мы включим в анализ ковариату знач.

Шаг 5а. После выполнения шага 4 у вас должно быть открыто диалоговое окно окно Multivariate (Многомерный анализ),показанное на рис. 16. Если вы уже успели поработать с этим окном, щелкните на кнопке Reset (Сброс).

1. Щелкните на переменной начало1, нажмите клавишу Shift и, не отпуская ее, щелкните на переменной конец1. В результате окажутся выделенными переменные начало1, средн1, конец1.

2. Щелкните на верхней кнопке со стрелкой, чтобы переместить выделенные переменные в список Dependent Variables (Зависимые переменные).

3. Щелкните сначала на переменной инт, чтобы выделить ее, а затем на второй сверху кнопке со стрелкой, чтобы переместить переменную в список Fixed Factor(s) (Постоянные факторы).

4. Повторите предыдущее действие для переменной част.

5. Щелкните сначала на знач, чтобы выделить ее, а затем на третьей сверху кнопке со стрелкой, чтобы переместить переменную в список Covariate(s) (Ковариаты).

6. Щелкните на кнопке ОК, чтобы открыть окно вывода.

В следующем примере демонстрируется использование нескольких описанных ранее параметров, генерирующих полезную статистическую и графическую информацию. Обратите внимание, что мы не включаем в данный анализ ковариату. Напоминаем, что для анализа с ковариатами парные сравнения неприменимы, поскольку все графики будут соответствовать не фактическим исходным данным, а данным, скорректированным влияниями ковариат. Кроме того, парные сравнения имеют смысл лишь для факторов, имеющих более двух уровней; по этой причине в данном примере парные сравнения не применяются. Если же у вас какой-либо фактор имеет более двух уровней, воспользуйтесь кнопкой Post Нос (Постфактум). Она действует практически идентично своему аналогу из диалогового окна One-Way ANOVA (Однофакторный дисперсионный анализ). Отличие лишь в том, что в данном случае следует указать каждый фактор, для которого необходимы парные сравнения.

Шаг 5б. После выполнения шага 4 у вас должно быть открыто диалоговое окно Multivariate (Многомерный анализ), показанное па рис. 16. Если вы уже успели поработать с этим окном, щелкните на Reset (Сброс).

1. Щелкните на переменной начало 1, нажмите клавишу Shift и, не отпуская ее, щелкните на переменной конец1. В результате окажутся выделенными переменные начало1, средн1, конец1.

2. Щелкните на верхней кнопке со стрелкой, чтобы переместить выделенные переменные в список Dependent Variables (Зависимые переменные).

3. Щелкните сначала на переменной инт, чтобы выделить ее, а затем – на второй сверху кнопке со стрелкой, чтобы переместить переменную в список Fixed Factor(s) (Постоянные факторы).

4. Повторите предыдущее действие для переменной част.

5. Щелкните на кнопке Plots (Диаграммы), чтобы открыть диалоговое окно Multivariate: Profile Plots (Многомерный анализ: Диаграммы профилей), показанное на рис. 18.

6. Щелкните сначала на переменной инт, чтобы выделить ее, а затем на верхней кнопке со стрелкой, чтобы переместить переменную в поле Horizontal Axis (Горизонтальная ось).

7. Щелкните сначала на переменной част, чтобы выделить ее, а затем на средней кнопке со стрелкой, чтобы переместить переменную в поле Separate Lines (Отдельные линии).

8. Щелкните сначала на кнопке Add (Добавление), чтобы зафиксировать заданные параметры построения диаграмм, а затем на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Multivariate (Многомерный анализ).

9. Щелкните на кнопке Options (Параметры), чтобы открыть диалоговое окно Multivariate: Options (Многомерный анализ: Параметры), показанное на рис. 20.

10. Щелкните сначала на переменной инт*част, чтобы выделить ее, а затем на кнопке со стрелкой, чтобы переместить переменную в список Display Means for (Отображать средние для).

11. Установите флажки Descriptive Statistics (Описательные статистики), Estimates of effect size (Оценивать величину воздействия), Homogeneity tests (Критерии однородности). Щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Multivariate (Многомерный анализ).

12. Щелкните на кнопке ОК, чтобы открыть окно вывода.

После выполнения шага 5 программа автоматически активизирует окно вывода. Для просмотра результатов при необходимости можно воспользоваться вертикальной и горизонтальной полосами прокрутки. Обратите внимание на стандартную строку меню в верхней части окна вывода: ее присутствие позволяет выполнять любые статистические операции, не переключаясь обратно в окно редактора данных.

Печать результатов и выход из программы

Ниже описана типичная процедура печати результатов статистического анализа (или анализов). После выполнения шага 5 должно быть открыто окно вывода.

Шаг 6. В окне вывода укажите фрагменты, выводимые на печать, в меню File (Файл) выберите команду Print (Печать), при необходимости задайте параметры печати и щелкните на кнопке ОК. Последнее, что необходимо сделать после завершения исследования и печати результатов, – это выйти из программы SPSS.

Шаг 7. Для выхода из программы в меню File (Файл) выберите команду Exit (Выход).

Иногда после выполнения команды Exit (Выход) на экране могут появляться небольшие диалоговые окна с вопросом о необходимости сохранения сделанных в файлах изменений и кнопками, описывающими возможные варианты ответа. Для завершения работы просто щелкайте на соответствующих кнопках.

Представление результатов

На представленных далее рисунках приведены наиболее важные фрагменты выводимых данных, генерируемых программой при выполнении шагов 5 и 5б.

Межгрупповые факторы

В таблице, представленной на рис. 21, перечислены все независимые переменные со своими уровнями и объемами выборок (N).

Рис. 21. Фрагмент окна вывода после выполнения шага 5 (межгрупповые факторы)

Описательные статистики

Таблица описательных статистик, полученная в результате выполнения шага 5 (на рис. 22 представлен только ее фрагмент), содержит средние значения, стандартные отклонения и объемы выборок для всех элементов модели.

Рис. 22. Фрагмент окна вывода после выполнения шага 5 (описательные статистики)

Проверка ковариационных матриц на равенство

На рис. 23 приведены результаты проверки теста различий ковариационных матриц. Эти результаты говорят о том, что ковариационные матрицы равны между собой (значение р-уровня значительно превышает 0,05). Если бы результаты теста были другими, то мы не могли бы ручаться за достоверность многомерного анализа, одним из условий проведения которого, является равенство ковариационных матриц.

Рис. 23. Фрагмент окно вывода после выполнения шага 5 (проверка ковариационных матриц на равенство)

Многомерные критерии

Таблица, показанная на рис. 24, - результат выполнения шага 5 (без ковариаты). В ней содержится информация, которая является результатом проверки влияния факторов и их взаимодействий на зависимые переменные. Секция Intercept (свободный член) характеризует остаточную дисперсию (как правило, дисперсию ошибки) и не подлежит интерпретации. Как можно видеть, обнаружены статистически значимые главные эффекты факторов инт и част (р < 0,05), но не выявлено взаимодействие этих факторов. Если в анализе участвуют ковариаты, они также отображаются в этой таблице. Выполнив шаг 5а, вы можете убедиться, что ковариата знач, применяемая в нашем примере, оказывает значимое влияние на зависимые переменные и меняет статистическую значимость влияния факторов и их взаимодействия.

Рис. 24. Фрагмент окна вывода после выполнения шага 5 (многомерные критерии)

Ниже дана трактовка терминов, используемых программой в окне вывода.

1. Value (Значение) – в этом столбце представлены значения различных критериев для проверки влияния независимых переменных. Из всех критериев наиболее надежным считается критерий Пилая (Pillai).

2. F (F-критерий) — оценка F-критерия.

3. Hypothesis df (Ст. св. гипотезы) – степень свободы гипотезы. Произведение числа зависимых переменных и уровней каждой независимой переменной, уменьшенных на 1. Для данного примера:

3        х (2 - 1) х (2 - 1) = 2 х 1 х 1 = 3.

5. Error df (Ст. св. ошибки) – величина, вычисляемая различными способами в зависимости от критерия.

6. Sig. (Значимость) – уровень значимости для соответствующего F-критерия.

Критерий равенства дисперсий

Критерий равенства дисперсий (критерий Ливиня) позволяет проверить допущение о том, что дисперсии всех зависимых переменных одинаковы (рис. 25). Большие значения р-уровня для каждой из зависимых переменных не дают поводов для излишнего беспокойства относительно корректности дисперсионного анализа.

Рис. 25. Фрагмент окна вывода после выполнения шага 5 (критерий равенства дисперсий)

Одномерные критерии

В дополнение к многомерным критериям для всех зависимых переменных, к каждой из них в отдельности применяется одномерный F -критерий. Несмотря на то, что многомерный критерий является более совершенным, чем серия одномерных критериев, последние необходимы для интерпретации статистически достоверных результатов применения многомерного критерия. Таким образом, если многомерный критерий дает статистически значимый результат, для детальной интерпретации используют результаты применения одномерных критериев.

В нашем случае статистически достоверными являются результаты применения многомерных критериев для главных эффектов факторов инт и част. На рис. 26 приведен фрагмент таблицы с результатами одномерного анализа, относящимися к этим факторам. Как видно по этому фрагменту, влияние фактора инт статистически достоверно в отношении двух из трех зависимых переменных: средн1 и конец1. Влияние фактора част статистически достоверно в отношении всех зависимых переменных. Для содержательной интерпретации применения одномерных критериев в нашем случае можно обратиться к описательным статистикам (средним), а лучше – к графикам средних значений. Если бы факторы имели более двух градаций, то перед интерпретацией необходимо было бы применить метод парных сравнений постфактум. В случае если анализ включает ковариаты, то для каждой зависимой переменной одномерный критерий также будет учитывать влияние этих ковариат.

Рис. 26. Фрагмент окна вывода после выполнения шага 5 (одномерные критерии)

Ниже дана трактовка терминов, используемых программой в окне вывода.

- Sum of Squares (Сумма квадратов) – для факторов и их взаимодействий это межгрупповая сумма квадратов, то есть сумма квадратов разностей между главным средним значением и средними значениями каждой группы с весовыми коэффициентами, кратными объему соответствующих выборок.

- df (Число степеней свободы) — для факторов и их взаимодействий это произведение чисел уровней независимых переменных, уменьшенных на единицу; для ошибки – разность между числом всех объектов и числом степеней свободы для факторов и их взаимодействий, уменьшенная на единицу.

- Mean Square (Средний квадрат) – отношение суммы квадратов для данного фактора или взаимодействия к числу степеней свободы.

- F (F-критерий) – отношение соответствующего среднего квадрата к среднему квадрату ошибки.

- Sig. (Значимость) – р-уровень для соответствующего F-критерия.

Оценки средних значений для уровней факторов

Таблицы, представленные на рис. 27, получены после выполнения шага 5б. Они содержат средние значения каждой зависимой переменной для каждой градации факторов. По этим данным можно дать подробную содержательную интерпретацию статистически достоверных результатов. Так, статистически достоверное влияние фактора инт на совокупность зависимых переменных было детализировано результатами применения одномерных критериев: фактор инт значимо влияет па переменные средн1 и конец1. Судя по средним значениям для этих переменных, интонационное выделение середины ряда слов приводит к тому, что эта часть ряда запоминается лучше, а конец ряда – хуже, чем без интонационного выделения. Влияние фактора част проявляется в том, что высокочастотные слова запоминаются лучше, чем низкочастотные, независимо от положения в ряду. Отсутствие статистически достоверного взаимодействия факторов инт и част свидетельствует о том, что влияние интонации на запоминание слов не зависит от частоты встречаемости запоминаемых слов (и наоборот, частоты встречаемости слов на их запоминание не зависит от интонации, с которой они предъявлялись).

Взаимодействие факторов легче всего интерпретировать по графикам средних, которые получены после выполнения шага 5б. На рис. 28 приведен один из этих графиков для переменной средн 1. Как показывает график, взаимодействие факторов весьма незначительно.

Рис. 27. Фрагмент окна вывода после выполнения шага 5б (оценки средних значений для уровней факторов)

Рис. 28. Фрагмент окна вывода после выполнения шага 5б (график средних)

4. Дисперсионный анализ с повторными изменениями

В предыдущем параграфе рассматривалась ситуация, когда необходимо было анализировать влияние на совокупность зависимых переменных нескольких независимых переменных, каждая из которых могла иметь два или более              уровней. В подобных случаях проводились межгрупповые сравнения: группам соответствовали уровни факторов и их сочетания. Такие факторы, разным уровням которых соответствуют группы объектов, называют межгрупповыми. Однако на практике нередко используются и внутригрупповые факторы, разным уровням которых соответствует одна и та же группа объектов. В этом случае говорят о внутригрупповой модели, с помощью которой исследуется одна и та же группа объектов для  нескольких уровней независимой переменной.

Наиболее распространенным примером применения внутригрупповой модели является исследование эффекта какого-либо взаимодействия. В этом случае обычно используются две выборки: на одну из них воздействие оказывается (экспериментальная выборка), а на другую – нет (контрольная выборка). Зависимые переменные. В отношении которых ожидается эффект воздействия, измеряются для обеих выборок дважды: до воздействия (предварительное тестирование) и после воздействия (итоговое тестирование).

Такая схема исследования предполагает изучение влияния на зависимые переменные двух факторов: межгруппового (два уровня: контрольная и экспериментальные выборки) и внутригруппового (два уровня: до и после воздействия). Следует обратить внимание, что внутригрупповому фактору в данном случае соответствуют два измерения одной и той же переменной (или группы переменных). В общем случае внутригрупповой фактор может иметь и большее число уровней (повторных измерений). Отметим, что наибольший интерес для исследователя будет представлять гипотеза о взаимодействии межгруппового и внутригруппового факторов. Если она подтвердится, можно будет утверждать, что обнаружены различия между контрольной и экспериментальной группами в динамике изменения зависимой переменной.

Для примеров будем использовать файл ex02.sav, содержащий гипотетические результаты эксперимента по изучению эффективности запоминания слов в зависимости от частоты их встречаемости и от интонации с которой они предъявлялись (зачитывались). Часть данных этого файла использовалась в предыдущем параграфе. В качестве зависимых переменных применялись показатели продуктивности запоминания ряда слов сразу после их предъявления: начало1 – для начала ряда; сред1 – для середины ряда; конец1 – для конца ряда. Независимыми переменными являлись: инт – интонационное выделение середины ряда (1 – нет, 2 – есть); част – частота встречаемости слов (1 – высокочастотные, 2 – низкочастотные); знач – эмоциональная значимость слов ряда (количественная переменная, используемая в качестве ковариаты). Добавим еще три зависимые переменные (начало2, средн2, конец2), соответствующие продуктивности отсроченного (через два дня после предъявления) воспроизведения ряда слов.

Таким образом, с добавлением повторных измерений трех зависимых переменных план исследования усложняется и может быть представлен как комбинация двух внутригрупповых факторов, двух межгрупповых факторов и одной ковариаты. Первый внутригрупповой фактор соответствует части ряда слов и имеет три уровня (начало, середина, конец). Второй внутригрупповой фактор – это отсрочка воспроизведения – имеет два уровня (без отсрочки, с отсрочкой в 2 дня). Нетрудно заметить, что существует шесть комбинаций уровней этих двух факторов, каждой из которых соответствует одна из переменных (табл. 1).

Таблица 1.

Сочетания комбинаций части ряда слов и отсрочки их воспроизведения

Часть ряда

Отсрочка воспроизведения

 

 

Нет

2 дня

 

Начало

начало1

Начало2

 

Середина

средн1

Средн2

 

Конец

Конец1

Конец2

 

Переменные, перечисленные в таблице, по сути представляют собой шесть повторных измерений одной и той же характеристики – продуктивности воспроизведения 8 предъявленных ранее слов. Поэтому для анализа таких данных используется модель многомерного дисперсионного анализа с повторными измерениями (Для выполнения многомерного анализа с повторными измерениями требуется полная установка пакета SPSS, включая модули Advanced Models (Дополнительные модели) и Regression Models (Регрессионные модели).

Модель многомерного дисперсионного анализа с повторными измерениями имеет много общего с моделью многомерного дисперсионного анализа без повторных измерений.

Пошаговые алгоритмы вычислений

При проведении многомерного дисперсионного анализас повторными измерениями сначала необходимо выполнить три подготовительных шага.

Эти шаги (шаг 1 – шаг 3) позволят подготовить рабочий файл данных, запустить программу SPSS for Windows 15.0 и открыть файл ex02.sav.

После завершения шага 3 на экране должно присутствовать окно редактора данных со строкой меню и загруженным файлом ex02.sav.

Шаг 4. В меню Analyze (Анализ) выберите команду General Linear Model – Repeated Measures (Общая линейная модель Повторные измерения). На экране появится диалоговое окно Repeated Measures Define Factor(s) (Повторные измерения: Определение факторов), показанное на рис. 29.

Рис. 29. Диалоговое окно Repeated Measures Define Factor(s)

В этом окне вам предстоит задать имена внутригрупповых факторов. Обратите внимание, что имена, которые вы будете вводить в поле Within-Subject Factor Name (Имя внутригруппового фактора), не относятся к существующим переменным из файла данных, а определяют виртуальные переменные для команды Repeated Measures (Повторные измерения). В нашем примере присвоим этим переменным (внутригрупповым факторам) имена часть_ряда (3 уровня: начало, середина, конец) и отсрочка (2 уровня).

Для задания имени внутригрупповой переменной сначала необходимо ввести его в поле Within-Subject Factor Name (Имя внутригруппового фактора), затем задать число уровней переменной в поле Number of Levels (Число уровней) и щелкнуть на кнопке Add (Добавление).

После того как внутригрупповые переменные (факторы) определены, чтобы завершить задание параметров анализа, щелкните на кнопке Define (Определить). На экране появится диалоговое окно Repeated Measures (Повторные измерения), представленное на рис. 30.

Рис. 30. Диалоговое окно Repeated Measures (для внутригрупповых факторов)

В левой части окна находится список переменных файла ex02.sav. В списке Within- Subjects Variables (Внутригрупповые переменные) вы можете указать соответствие между переменными файла и каждым уровнем внутригруппового фактора.

В нашем случае в анализ включены два внутригрупповых фактора, один из которых имеет два, а другой – три уровня; таким образом, каждой из шести комбинаций уровней необходимо сопоставить переменную из исходного списка. Пары чисел, указанные в скобках в Within- Subjects Variables (Внутригрупповые переменные), определяют, к какой ячейке модели относятся переменные файла, которые далее будут обозначаться как внутригрупповые переменные (табл. 2).

Таблица 2

Соответствие переменных файла и ячеек модели с двумя факторами

Переменная

Ячейка

Отсрочка

Часть ряда

начало1

(1,1)

Нет – 1

Начало – 1

средн1

(1,2)

Нет – 1

Середина – 2

конец1

(1,3)

Нет – 1

Конец – 3

начало2

(2,1)

Есть – 2

Начало – 1

средн2

(2,2)

Есть – 2

Середина – 2

конец2

(2,3)

Есть – 2

Конец – 3

Обратите внимание, что при движении от начала к концу списка переменных файла (первый столбец табл. 2) градации фактора «отсрочка» меняются реже, чем градации фактора «часть ряда». Поэтому в качестве первого фактора лучше выбирать тот, который имеет меньше уровней. Несмотря на то, что эта иллюстрация относится к случаю двух факторов с небольшим числом уровней, она с легкостью может быть для любого числа факторов и их уровней.

Для того чтобы ввести какую-либо переменную в список Within-Subjects Variables (Внутригрупповые переменные), достаточно выделить ее имя в списке слева и щелкнуть на верхней кнопке с направленной вправо стрелкой.

По умолчанию SPSS сопоставляет первую введенную переменную первой ячейке модели (в нашем случае – ячейке 1,1), вторую переменную – второй ячейке (1,2) и т. д. Если же вы хотите нарушить данный порядок, воспользуйтесь кнопками с направленными вверх и вниз стрелками, чтобы переместить введенную переменную в нужное место списка ячеек.

После того как все внутригрупповые зависимые переменные анализа определены, вы можете указать все межгрупповые переменные (факторы) и ковариаты. Для этого переместите из исходного списка в списки Between-Subjects Factor(s) (Межгрупповые факторы) и Covariates (Ковариаты).

В нижней части диалогового окна Repeated Measures (Повторные измерения) расположены шесть кнопок: Model (Модель), Contrasts (Контрасты), Plots (Диаграммы), Post Hoc (Постфактум), Save (Сохранение) и Optionsараметры). Щелчок на кнопке Options (Параметры) открывает диалоговое окно, идентичное окну Multivariate: Options (Многомерный анализ: Параметры). Кнопка Plots (Диаграммы) позволяет задавать диаграммы не только для межгрупповых, но и для внутригрупповых факторов. Функции кнопки Post Hoc (Постфактум) также остались прежними; отличием является то, что парные апостериорные сравнения применимы только к межгрупповым факторам.

При щелчке на кнопке Model (Модель) открывается диалоговое окно Repeated Measures: Model (Повторные измерения: Модель), представленное на рис. 31. В большинстве случаев исследователи предпочитают пользоваться полнофакторной моделью и не меняют положение переключателей в группе Specify Model (Выбор модели). Тем не менее, иногда требуется задать набор главных эффектов и взаимодействий вручную. Для этого следует установить переключатель Custom (Настройка), а затем переместить желаемые эффекты и взаимодействия из левых списков в правые. Заметьте, что вы не сможете переместить межгрупповые факторы во внутригрупповую секцию модели и наоборот, так как это некорректно. После того как желаемая модель определена, щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Repeated Measures (Повторные измерения).

Рис. 31. Диалоговое окно Repeated Measures: Model

Далее будут приведены два примера использования команды Repeated Measures (Повторные измерения). В первом примере мы проведем дисперсионный анализ с повторными измерениями, с двумя внутригрупповыми факторами: части ряда (3 градации) и отсрочкой воспроизведения (две градации). С каждой из шести ячеек модели будет связана одна из переменных начало1, средн1, конец1, начало2, средн2, конец2.

Шаг 5. После выполнения предыдущего шага у вас должно быть открыто диалоговое окно Repeated Measures Define Factor(s) (Повторные измерения: Определение факторов), показанное на рис. 29. Если вы уже успели поработать с этим окном, щелкните на кнопке Reset (Сброс).

1. С помощью клавиши Delete или Backspace удалите имя factor1 из поля Within-Subject Factor Name (Имя внутригруппового фактора), введите туда имя отсроч, нажмите клавишу Tab, чтобы переместить фокус ввода в поле Number of Levels (Число уровней), введите число 2 и щелкните на кнопке Add (Добавление).

2. В поле Within-Subject Factor Name (Имя внутригруппового фактора) введите имя ч_ряда, нажмите клавишу Tab , чтобы переместить фокус ввода в поле Number of Levels (Число уровней), введите число 3 и щелкните сначала на кнопке Add (Добавление), а потом  на кнопке Define (Определить), чтобы открыть диалоговое окно Repeated Measures (Повторные измерения), показанное на рис. 30.

3. Наведите указатель мыши на переменную начало1, нажмите кнопку мыши и, не отпуская ее, переместите указатель на переменную конец2 и отпустите кнопку. В результате окажутся шесть переменных: начало1, средн1, конец1, начало2, средн2, конец2.

4. Щелкните на верхней кнопке с направленной вправо стрелкой, чтобы переместить выделенные переменные в список Within-Subject Variables (Внутригрупповые переменные).

5. Щелкните на кнопке Options (Параметры), чтобы открыть диалоговое окно Repeated Measures: Options (Повторные измерения: Параметры).

6. Установите флажки Descriptive statistics (Описательные статистики) и Estimates of effect size (Оценивать величину эффекта), а затем щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Repeated Measures (Повторные измерения).

7. Щелкните на кнопке ОК, чтобы открыть окно вывода.

Следующий пример относится к проведению смешанного анализа с участием одного внутригруппового (ч_ряда) и двух межгрупповых факторов (инт, част). Кроме того, в анализе участвует ковариата знач.

Шаг 5а. После выполнения шага 4 у вас должно быть открыто диалоговое окно: Repeated Measures Define Factor(s) (Повторные измерения: Определение факторов), показанное на рис. 29. Если вы уже успели поработать с этим окном, щелкните на кнопке Reset (Сброс).

1. С помощью клавиши Delete или Backspace удалите имя factor1 из поля Within-Subject Factor Name (Имя внутригруппового фактора), введите туда имя ч_ряда, нажмите клавишу Tab, чтобы переместить фокус ввода в поле Number of Levels (Число уровней), введите число 3 и щелкните на кнопке Add (Добавление), а потом – на иконке Defineпределить), чтобы открыть диалоговое окно Repeated Measures (Повторные измерения), показанное на рис. 30.

2. Наведите указатель мыши на переменную начало2, нажмите кнопку мыши и, не отпуская ее, переместите указатель па переменную конец2  и отпустите кнопку. В результате окажутся выделенными три переменные: начало2, средн2 и конец2.

3. Щелкните на верхней кнопке с направленной вправо стрелкой, чтобы переместить выделенные переменные в список Within-Subjects Variables (Внутригрупповые переменные).

4. Щелкните сначала па переменной инт, чтобы выделить ее, а затем на средней кнопке с направленной вправо стрелкой, чтобы переместить переменную в список Between-Subjects Factor(s) (Межгрупповые факторы).

5. Щелкните сначала на переменной знач, чтобы выделить ее, а затем на нижней кнопке с направленной вправо стрелкой, чтобы переместить переменную в список Covariates (Ковариаты).

6. Щелкните на кнопке Options (Параметры), чтобы открыть диалоговое окно Repeated Measures: Options (Повторные измерения: Параметры).

7. Установите флажки Descriptive statistics (Описательная статистика) и Estimates of effect size (Оценивать величину эффекта), а затем щелкните па кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Repeated Measures (Повторные измерения).

8. Щелкните па кнопке ОК, чтобы открыть окно вывода.

После выполнения шага 5 программа автоматически активизирует окно вывода. Для просмотра результатов вы при необходимости можете воспользоваться вертикальной и горизонтальной полосами прокрутки. Обратите внимание на стандартную строку меню в верхней части окна вывода: ее присутствие позволяет выполнять любые статистические операции, не переключаясь обратно в окно редактора данных.

Печать результатов и выход из программы

Ниже описана типичная процедура печати результатов статистического анализа (или анализов). После выполнения шага 5 должно быть открыто окно вывода.

Шаг 6. В окне вывода укажите фрагменты, выводимые на печать, в меню File (Файл) выберите команду Print (Печать), при необходимости задайте параметры печати и щелкните на кнопке ОК. Последнее, что необходимо сделать после завершения исследования и печати результатов, – это выйти из программы SPSS.

Шаг 7. Для выхода из программы в меню File (Файл) выберите команду Exit (Выход).

Иногда после выполнения команды Exit (Выход) на экране могут появляться небольшие диалоговые окна с вопросом о необходимости сохранения сделанных в файлах изменений и кнопками, описывающими возможные варианты ответа. Для завершения работы просто щелкайте на соответствующих кнопках.

Представление результатов

Большая часть результатов, генерируемых командой Repeated Measures (Повторные измерения), аналогична результатам многомерного дисперсионного анализа (MANOVA), поэтому ниже будут представлены лишь те фрагменты, которые являются специфичными для внутригрупповых моделей. Также не приводятся некоторые результаты, которые являются избыточными и практически не требуют интерпретации, например внутригрупповые контрасты (Tests ofWithin-Subjects Contrasts).

Многомерные критерии

Таблица, показанная на рис. 32, получена после выполнения шага 5.

Рис. 32. Фрагмент окна вывода после выполнения шага 5 (многомерные критерии)

Как видно из таблицы, главные эффекты факторов отсрочки воспроизведения и части ряда являются значимыми (р < 0,05), поэтому для их интерпретации можно непосредственно сравнить средние значения соответствующих ячеек либо применить t-критерий. В данном случае мы можем сделать вывод, что с отсрочкой ухудшается воспроизведение предъявленных слов; эффективность воспроизведения начала ряда хуже, чем середины и конца ряда; эти эффекты проявляются независимо друг от друга. Все это иллюстрирует диаграмма (рис. 33), которую вы можете легко построить, щелкнув на кнопке Plots (Диаграммы) в окне Repeated Measures (Повторные измерения), показанном ранее на рис. 29.

Рис. 33. Фрагмент окна вывода после выполнения шага 5 (график средних)

В случае если вы используете смешанную модель, то в выводимые данные будут включены эффекты взаимодействий для внутригрупповых и межгрупповых факторов. Если в модели присутствуют ковариаты, то выводимые данные будут содержать результаты их взаимодействия с внутригрупповыми факторами. Ниже дана трактовка терминов, используемых программой в окне вывода и относящихся к многомерным критериям.

- Value (Значение) – в этом столбце представлены значения многомерных критериев, определяющих достоверность различия повторных измерений для соответствующих впутригрупновых факторов.

- F(F-критерий) — значение F-критерия.

- Hypothesis df (Гипотетическое число степеней свободы) – произведение числа уровней факторов, уменьшенных на единицу.

- Error df (Ошибка числа степеней свободы) – величина, вычисляемая различными способами в зависимости от теста.

- Sig. (Значимость) – уровень значимости для соответствующего F-критерия.

Проверка внутригрупповых эффектов

Таблица, показанная на рис. 34, получена после выполнения шага 5а.

Рис. 34. Фрагмент окна вывода после выполнения шага 5а (проверка внутригрупповых эффектов: многомерные критерии)

Полученные результаты во многом дублируют результаты применения многомерных критериев. Таблица содержит главный эффект внутригруппового фактора (ч_ряда), а также эффекты его взаимодействия с ковариатой (знач) и межгрупповым фактором (инт). Все эффекты оказываются статистически достоверными. Обратите внимание на то, что данные результаты относятся к совокупности всех 3 зависимых переменных.

Рис. 35. Фрагмент окна вывода после выполнения шага 5а (проверка внутригрупповых эффектов: одномерные критерии)

Если многомерные критерии внутригрупповых эффектов дают статистически достоверные результаты, то для детальной интерпретации результатов следует обратиться к следующей таблице внутригрупповых эффектов: «Одномерные критерии» (рис. 35)

Одномерные критерии показывают, что взаимодействие факторов инт и отсроч является статистически достоверным в отношении переменных середина и конец. Для интерпретации взаимодействия следует обратиться к графикам средних значений (рис. 36)

Рис. 36. Фрагмент окна вывода после выполнения шага 5а (график средних)

Судя по графику, взаимодействие факторов инт и отсроч обусловлено более продуктивным воспроизведением слов середины ряда в случае их интонационного выделения. Главный эффект фактора отсроч обусловлен тем, что слова в начале ряда воспроизводились хуже, чем слова в середине и конце ряда.

Оценка эффектов межгрупповых факторов

Таблица, показанная на рис. 37, получена после выполнения шага 5а.

Рис. 37. Фрагмент окна вывода после выполнения шага 5а (оценка эффектов межгрупповых эффектов)

Межгрупповые эффекты фактора инт демонстрируют статистически достоверные результаты в отношении переменных середина и конец. Это значит, что влияние интонационного выделения на эти переменные проявляется независимо от отсрочки.

Информация о работе Дисперсионный анализ с повторными изменениями