Методы математической статистики

Автор работы: Пользователь скрыл имя, 02 Октября 2011 в 13:55, контрольная работа

Описание работы

Психология получила статус науки благодаря эксперименту и использованию математики при обработке экспериментальных данных и психологических исследований. Математика в психологии служит таким логическим инструментом доказательства, давая возможность научного понимания психологических закономерностей и более глубокого их анализа Математическая статистика - область современной математики, основанная на теории вероятностей и занятая поиском законов изменения и способов измерения случайных величин, обоснованием методов расчетов, производимых с такими величинами.

Файлы: 1 файл

Реферат по методологии.docx

— 129.83 Кб (Скачать файл)

     Графическое выражение регрессионного уравнения  называют линией регрессии. Линия регрессии  выражает наилучшие предсказания зависимой  переменой (Y) по независимым переменным (X).

     Регрессию выражают с помощью двух уравнений  регрессии, которые в самом прямом случае выглядят, как уравнения прямой.

Y = a 0 + a 1 * X (1)

X = b 0 + b 1 * Y (2) 

     В уравнении (1) Y - зависимая переменная, X - независимая переменная, a 0 - свободный член, a 1 - коэффициент регрессии, или угловой коэффициент, определяющий наклон линии регрессии по отношению к осям координат.

     В уравнении (2) X - зависимая переменная, Y - независимая переменная, b 0 - свободный член, b 1 - коэффициент регрессии, или угловой коэффициент, определяющий наклон линии регрессии по отношению к осям координат.

     Количественное  представление связи (зависимости) между Х и Y (между Y и X) называется регрессионным анализом. Главная задача регрессионного анализа заключается в нахождении коэффициентов a 0, b 0, a1и b 1 и определении уровня значимости полученных аналитических выражений, связывающих между собой переменные Х и У.

     При этом коэффициенты регрессии a 1 и b 1 показывают, насколько в среднем величина одной переменной изменяется при изменении на единицу меры другой. Коэффициент регрессии a 1 в уравнении можно подсчитать по формуле:

     

     а коэффициент b 1 в уравнении по формуле

     

     где ryx - коэффициент корреляции между переменными X и Y;

     Sx - среднеквадратическое отклонение, подсчитанное для переменной X;

     Sy - среднеквадратическое отклонение, подсчитанное для переменной У/

     Для применения метода линейного регрессионного анализа необходимо соблюдать следующие  условия:

     1. Сравниваемые переменные Х и  Y должны быть измерены в шкале интервалов или отношений.

     2. Предполагается, что переменные  Х и Y имеют нормальный закон распределения.

     3. Число варьирующих признаков  в сравниваемых переменных должно быть одинаковым. [ 4 ; 263 ].

Корреляционный  анализ . Следующий метод вторичной статистической обработки, посредством которого выясняется связь или прямая зависимость между двумя рядами экспериментальных данных, носит название метод корреляций. Он показывает, каким образом одно явление влияет на другое или связано с ним в своей динамике. Подобного рода зависимости существуют, к примеру, между величинами, находящимися в причинно-следственных связях друг с другом. Если выясняется, что два явления статистически достоверно коррелируют друг с другом и если при этом есть уверенность в том, что одно из них может выступать в качестве причины другого явления, то отсюда определенно следует вывод о наличии между ними причинно-следственной зависимости. [6;576]

     Когда повышение уровня одной переменной сопровождается повышением уровня другой, то речь идёт о положительной корреляции. Если же рост одной переменной происходит при снижении уровня другой, то говорят  об отрицательной корреляции. При  отсутствии связи переменных мы имеем дело с нулевой корреляцией.

     Имеется несколько разновидностей данного  метода: линейный, ранговый, парный и множественный. Линейный корреляционный анализ позволяет устанавливать прямые связи между переменными величинами по их абсолютным значениям. Эти связи графически выражаются прямой линией, отсюда название "линейный". Ранговая корреляция определяет зависимость не между абсолютными значениями переменных, а между порядковыми местами, или рангами, занимаемыми ими в упорядоченном по величине ряду. Парный корреляционный анализ включает изучение корреляционных зависимостей только между парами переменных, а множественный, или многомерный, - между многими переменными одновременно. Распространенной в прикладной статистике формой многомерного корреляционного анализа является факторный анализ. [6; 577 ]

     Коэффициент линейной корреляции определяется при  помощи следующей формулы:

          где rxy - коэффициент линейной корреляции;

     х, у - средние выборочные значения сравниваемых величин;

     хi, уi - частные выборочные значения сравниваемых величин;

     n - общее число величин в сравниваемых рядах показателей;

     S2x, S2y - дисперсии, отклонения сравниваемых величин от средних значений.К коэффициенту ранговой корреляции в психолого-педагогических исследованиях обращаются в том случае, когда признаки, между которыми устанавливается зависимость, являются качественно различными и не могут быть достаточно точно оценены при помощи так называемой интервальной измерительной шкалы. Большинство показателей, которые получают в психолого-педагогических исследованиях, относятся к порядковым, а не к интервальным шкалам (например, оценки типа "да", "нет", "скорее нет, чем да" и другие, которые можно переводить в баллы), поэтому коэффициент линейной корреляции к ним неприменим. В этом случае обращаются к использованию коэффициента ранговой корреляции, формула которого следующая:

     

           где Rs - коэффициент ранговой корреляции по Спирмену;

     di - разница между рангами показателей одних и тех же испытуемых в упорядоченных рядах;

     n - число испытуемых или цифровых данных (рангов) в коррелируемых рядах.

     Метод множественных корреляций в отличие  от метода парных корреляций позволяет  выявить общую структуру корреляционных зависимостей, существующих внутри многомерного экспериментального материала, включающего  более двух переменных, и представить  эти корреляционные зависимости  в виде некоторой системы.

     Для применения частного коэффициента корреляции необходимо соблюдать  следующие условия:

     1. Сравниваемые переменные должны  быть измерены в шкале интервалов  или отношений.

     2. Предполагается, что все переменные  имеют нормальный закон распределения.

     3. Число варьирующих признаков  в сравниваемых переменных должно  быть одинаковым.

     4. Для оценки уровня достоверности  корреляционного отношения Пирсона  следует пользоваться формулой (11.9) и таблицей критических значений  для t-критерия Стьюдента при k = n - 2. [ 4 ; 253 ] Корреляционный анализ позволяет обнаружить наличие связи но не даёт оснований для установления причинно- следственных отношений.

Факторный анализ . Факторный анализ - статистический метод, который используется при обработке больших массивов экспериментальных данных. Задачами факторного анализа являются: сокращение числа переменных (редукция данных) и определение структуры взаимосвязей между переменными, т.е. классификация переменных, поэтому факторный анализ используется как метод сокращения данных или как метод структурной классификации.

     Важное  отличие факторного анализа от всех описанных выше методов заключается  в том, что его нельзя применять  для обработки первичных, или, как  говорят, "сырых", экспериментальных  данных, т.е. полученных непосредственно  при обследовании испытуемых. Материалом для факторного анализа служат корреляционные связи, а точнее - коэффициенты корреляции Пирсона, которые вычисляются между  переменными (т.е. психологическими признаками), включенными в обследование. Иными  словами, факторному анализу подвергают корреляционные матрицы, или, как их иначе называют, матрицы интеркорреляций. Наименования столбцов и строк в этих матрицах одинаковы, так как они представляют собой перечень переменных, включенных в анализ. По этой причине матрицы интеркорреляций всегда квадратные, т.е. число строк в них равно числу столбцов, и симметричные, т.е. на симметричных местах относительно главной диагонали стоят одни и те же коэффициенты корреляции.

     Главное понятие факторного анализа - фактор. Это искусственный статистический показатель, возникающий в результате специальных преобразований таблицы коэффициентов корреляции между изучаемыми психологическими признаками, или матрицы интеркорреляций. Процедура извлечения факторов из матрицы интеркорреляций называется факторизацией матрицы. В результате факторизации из корреляционной матрицы может быть извлечено разное количество факторов вплоть до числа, равного количеству исходных переменных. Однако факторы, выделяемые в результате факторизации, как правило, неравноценны по своему значению. Элементы факторной матрицы называется «факторными нагрузками или весами».При этом факторный вес демонстрирует меру или тесноту этой связи. [ 4; 276]

     С помощью выявленных факторов объясняют  взаимозависимость психологических явлений.

     Чаще  всего в итоге факторного анализа  определяется не один, а несколько  факторов, по-разному объясняющих  матрицу интеркорреляций переменных. В таком случае факторы делят на генеральные, общие и единичные. Генеральными называются факторы, все факторные нагрузки которых значительно отличаются от нуля (нуль нагрузки свидетельствует о том, что данная переменная никак не связана с остальными и не оказывает на них никакого влияния в жизни). Общие - это факторы, у которых часть факторных нагрузок отлична от нуля. Единичные - это факторы, в которых существенно отличается от нуля только одна из нагрузок. [6; 283 ]

     Факторный анализ может быть уместен, если выполняются  следующие критерии.

     1. Нельзя факторизовать качественные  данные, полученные по шкале наименований, например, такие, как цвет волос  (черный / каштановый / рыжий) и т.п.

     2. Все переменные должны быть  независимыми, а их распределение  должно приближаться к нормальному.

     3. Связи между переменными должны  быть приблизительно линейны  или, по крайней мере, не иметь  явно криволинейного характера.

     4. В исходной корреляционной матрице  должно быть несколько корреляций  по модулю выше 0,3. В противном  случае достаточно трудно извлечь  из матрицы какие-либо факторы.

     5. Выборка испытуемых должна быть  достаточно большой. Рекомендации  экспертов варьируют. Наиболее  жесткая точка зрения рекомендует  не применять факторный анализ, если число испытуемых меньше 100, поскольку стандартные ошибки  корреляции в этом случае окажутся слишком велики.

     Однако  если факторы хорошо определены (например, с нагрузками 0,7, а не 0,3), экспериментатору нужна меньшая выборка, чтобы  выделить их. Кроме того, если известно, что полученные данные отличаются высокой  надежностью (например, используются валидные тесты), то можно анализировать данные и по меньшему числу испытуемых. [4;283].

В теоретическом  плане использование факторного анализа связано с разработкой так называемого факторно-аналитического подхода к изучению структуры личности, темперамента и способностей. Использование факторного анализа в этих сферах основано на широко принятом допущении, согласно которому наблюдаемые и доступные для прямого измерения показатели являются лишь косвенными и/или частными внешними проявлениями более общих характеристик. Эти характеристики, в отличие от первых, являются скрытыми, так называемыми латентными переменными, поскольку они представляют собой понятия или конструкты, которые не доступны для прямого измерения. Однако они могут быть установлены путем факторизации корреляционных связей между наблюдаемыми чертами и выделением факторов, которые (при условии хорошей структуры) можно интерпретировать как статистическое выражение искомой латентной переменной. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

      Заключение.

     Как говорит Мак-Коннелл, статистика — это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статистикой. Хотим ли мы спланировать бюджет, рассчитать потребление бензина автомашиной, оценить усилия, которые потребуются для усвоения какого-то курса, с учетом полученных до сих пор отметок, предусмотреть вероятность хорошей и плохой погоды по метеорологической сводке или вообще оценить, как повлияет то или иное событие на наше личное или совместное будущее, — нам постоянно приходится отбирать, классифицировать и упорядочивать информацию, связывать ее с другими данными так, чтобы можно было сделать выводы, позволяющие принять верное решение. 
Все эти виды деятельности мало отличаются от тех операций, которые лежат в основе научного исследования и состоят в синтезе данных, полученных на различных группах объектов в том или ином эксперименте, в их сравнении с целью выяснить черты различия между ними, в их сопоставлении с целью выявить показатели, изменяющиеся в одном направлении, и, наконец, в предсказании определенных фактов на основании тех выводов, к которым приводят полученные результаты. Именно в этом заключается цель статистики в науках вообще, особенно в гуманитарных. В последних нет ничего абсолютно достоверного, и без статистики выводы в большинстве случаев были бы чисто интуитивными и не могли бы составлять солидную основу для интерпретации данных, полученных в других исследованиях. Если данные, полученные в эксперименте, качественного характера, то правильность делаемых на основе их выводов полностью зависит от интуиции, эрудиции и профессионализма исследователя, а также от логики его рассуждений. Если же эти данные количественного типа, то сначала проводят их первичную, а затем вторичную статистическую обработку. Первичная статистическая обработка заключается в определении необходимого числа элементарных математических статистик. Такая обработка почти всегда предполагает как минимум определение выборочного среднего значения. В тех случаях, когда информативным показателем для экспериментальной проверки предложенных гипотез является разброс данных относительного среднего, вычисляется дисперсия или квадратическое отклонение. Значение медианы рекомендуется вычислять тогда, когда предполагается использовать методы вторичной статистической обработки, рассчитанные на нормальное распределение, Для такого рода распределения выборочных данных медиана, а также мода совпадают или достаточно близки к средней величине. Этим критерием можно воспользоваться для того, чтобы приблизительно судить о характере полученного распределения первичных данных.

Информация о работе Методы математической статистики