Автор работы: Пользователь скрыл имя, 11 Ноября 2009 в 17:11, Не определен
Организация и задачи статистики на современном этапе.
S(-1) – накопленная частота интервала, предшествующая медианному
Fme – частота медианного интервала
Ме =
Хме + i * (((n+1)/2)-S(-1))/fme
26.
Соотношение средней,
моды и медианы
в вариационном
ряду.
27. Показатели степени вариации (размах, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия).
1.Размах колебаний, или размах вариации, представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности.
R=Xmax-Xmin
2. Среднее квадратическое отклонение – это обобщающая характеристика абсолютных размеров вариаций признака в совокупности.
∂=√∂2
3. Дисперсия – это средняя арифметическая квадратов отклонений индивидуального значения признака от общей средней.
∂2=∑((хi-x(сред.))2)/∑ni
4.
Среднее линейное отклонение вычисляется
по формуле:
d(сред.) = ∑|хi-х(сред.)|
/ n – для несгруппированных
данных
d(сред.) = ∑|хi-х(сред.)| * fi / ∑fi – для сгруппированных данных
28. Показатель однородности совокупности – коэффициент вариации.
V=∂/x*100% - показатель относительной колеблемости.
Всегда выражается в %.
Если V < 33%, то
совокупность считается однородной.
29. Виды дисперсий: внутригрупповая, межгрупповая и общая. Правило сложения дисперсий.
Общая дисперсия – ее величина характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц данной совокупности.
Межгрупповая дисперсия – отражает систематическую вариацию, т.е. те различия в величине изучаемого признака, которые возникают под влиянием фактора положенного в основу группировки.
∂2
= ∑((Хi(сред.)-Хо(сред.))*ni)/∑n
где Хi – среднее по отдельной группе, а Хо – для всей совокупности.
Средняя внутригрупповая дисперсия – характеризует случайную вариацию, возникающую под влиянием неучтенных факторов, и не зависит от признака фактора, положенного в основу группировки.
∂2 (сред.) = ∑(∂i2*ni)/ ∑ni,
где ∂i2 – дисперсия по отдельной группе, ∂i2=∑(Х-Хi)2*F/∑F
Перечисленные виды дисперсий взаимосвязаны между собой следующим равенством:
∂2=∂2+∂2(сред.)
Это равенство – правило сложения дисперсий:
Величина
общей дисперсии
равна сумме межгрупповой
и средней внутригрупповой
дисперсии.
30. Вариации альтернативного признака.
Альтернативный признак – это качественный признак, имеющий 2 взаимоисключающие разновидности.
АП принимает всего 2 значения:
p+q=1,
где p – это доля обладающих признаком
q – не обладающих признаком.
Среднее значение альтернативного признака рассчитывается по формуле:
Х(сред.) = ((1* p)+(0* q))/ (p+q)= p
Дисперсия альтернативного признака рассчитывается по формуле:
∂2=((1-p)2*p+(0-p)2*q)/ p+q= p*q
Предельное значение вариации альтернативного признака = 0,25, оно получается, когда p=q=0,5.
31. Показатели формы распределения (показатель асимметрии, эксцесса).
Существует еще одна характеристика распределения данных, полученных по непрерывным шкалам, которую исследователь тоже должен обязательно учитывать. Это форма распределения.
Данные распределения старшеклассников по возрасту являются примером нормального распределения. Нормальным является такое распределение, при котором кривая построенного по его данным графика представляет собой колоколообразную симметричную кривую.
Например, если мы построим график по данным распределения старшеклассников по возрасту, то получим соответствующую колоколообразную кривую. Если же мы построим график по массиву третьеклассников и учителей, опрошенных в одной школе, мы получим две кривые. Нормальное распределение — это теоретическая кривая. Практически любые эмпирические данные в той или иной степени отклоняются от нормального распределения вероятностей, закону которого подчиняются распределения случайных величин. Но поскольку все расчеты, включающие значение среднего арифметического и стандартного отклонения, основаны на теории вероятности, в аналитическую задачу исследователя входит оценка (по крайней мере, приблизительная) того, насколько правомерно использовать данный тип анализа к полученным результатам. Поэтому даже на уровне описания (не говоря уже о множественном анализе), прежде чем приводить данные по их средним значениям (среднее арифметическое и стандартное отклонение), необходимо оценить характер формы распределения — в какой степени она приближается к нормальному распределению.
Для этого используют показатели скоса (асимметрии, skewness) и эксцесса (kurtosis). В скобках указываются термины, которые обычно у разных авторов используются для обозначения одних и тех же понятий. В частности, здесь приведены англоязычные обозначения рассматриваемых характеристик, которые приводятся в компьютерной программе обработки и анализа социологических данных — SPSS.
Показатель скоса
(skewness) позволяет оценить степень
и направленность асимметрии кривой
распределения. В случае идеального
нормального распределения
В эмпирической социологии идеальные нормальные распределения практически не встречаются. Но существуют методы оценки степени приближения полученного распределения к нормальному. Коэффициент скоса имеет числовое значение и знак, указывающий направленность скоса. Чем больше величина отличается от нуля, тем большая асимметрия у полученного распределения, и, соответственно, большая погрешность может проявиться при применении коэффициентов статистического анализа, формула которых включает значения стандартного отклонения.
Существуют специальные процедуры оценки степени допустимости такой погрешности, а также искусственной нормализации шкалы. Исследователь может, при необходимости, осуществлять преобразование данных. С различными способами преобразования данных можно ознакомиться в специальной справочной и учебной литературе; но исследователю необходимо обязательно оценить степень асимметрии. (Простейшим косвенным показателем, указывающим на асимметрию, является расхождение между значениями среднего арифметического, моды и медианы; при идеальном нормальном распределении все три показателя равны).
Показатель эксцесса (kurtosis) показывает, в какой степени «крутизна» полученной кривой приближается к нормальному распределению.
Показатели асимметрии
и эксцесса необходимы исследователю
в первую очередь для того, чтобы он мог
установить — в какой степени в анализе
может быть использовано стандартное
отклонение.
32. Кривые распределения. Критерии согласия
Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда. При попытке изображения этих данных графически мы получим некоторую плавную кривую линию, которая для полигона частот будет являться некоторым пределом. Эту линию называют кривой распределения.
Иными словами, кривая распределения есть графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, которое функционально связано с изменением вариант. Кривая распределения отражает закономерность изменения частот при отсутствии случайных факторов. Графическое изображение облегчает анализ рядов распределения.
Известно достаточно много форм кривых распределения, по которым может выравниваться вариационный ряд, но в практике статистических исследований наиболее часто используются такие формы, как нормальное распределение и распределение Пуассона.
При помощи этой формулы мы получаем теоретическое (вероятностное) распределение, заменяя им эмпирическое (фактическое) распределение, по характеру они не должны отличаться друг от друга.
Тем не менее в ряде случаев, если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии (), такой ряд выравнивается по кривой Пуассона
Кривую Пуассона можно выразить отношением
где Px - вероятность наступления отдельных значений х; - средняя арифметическая ряда.
При выравнивании эмпирических данных теоретические частоты можно определить по формуле
где f' - теоретические частоты; N - общее число единиц ряда.
Сравнивая полученные величины теоретических частот f' c эмпирическими (фактическими) частотами f, убеждаемся, что их расхождения могут быть весьма невелики.
Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.
Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.
В том случае, если отсутствуют таблицы для оценки случайности расхождения теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского КРом , который, используя величину , предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения
где m - число групп; k = (m - 3 ) - число степеней свободы при исчислении частот нормального распределения.
Если вышеуказанное отношение < 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение > 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть.
Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле
где D - максимальное значение разности между накопленными эмпирическими и теоретическими частотами; - сумма эмпирических частот.
По таблицам значений вероятностей - критерия можно найти величину , соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.
Необходимым условием
при использовании критерия согласия
Колмогорова является достаточно большое
число наблюдений (не меньше ста).