Понятие вариации и её видов

Автор работы: Пользователь скрыл имя, 11 Октября 2010 в 22:05, Не определен

Описание работы

Реферат

Файлы: 1 файл

Курсовая по статистике.docx

— 150.55 Кб (Скачать файл)

                

                                Свойства дисперсии.

1) Уменьшение или увеличение весов (частот) варьирующего признака в определенное число раз дисперсии не изменяет.

2) Уменьшение или увеличение каждого значения признака на одну  и ту же постоянную величину А дисперсии не изменяет.

 3)Уменьшение или увеличение каждого значения признака в какое-то число раз  к  соответственно  уменьшает или увеличивает дисперсию в раз, а среднее квадратическое отклонение - в к раз.

4) Дисперсия признака  относительно произвольной величины всегда больше дисперсии относительно средней арифметической на  квадрат разности между средней и произвольной величиной: . Если А равна нулю,  то приходим к следующему равенству: , т.е. дисперсия признака равна разности между средним квадратом значений признака и квадратом средней.

    Каждое  свойство при расчете дисперсии  может быть применено самостоятельно или в сочетании с другими.

                       Порядок расчета дисперсии простой:

    1) определяют среднюю арифметическую  ;

    2) возводят в квадрат среднюю  арифметическую ;

    3) возводят в квадрат каждую  варианту ряда  ;

    4) находим сумму квадратов вариант  ;

    5) делят сумму квадратов вариант  на их число,  т.е. определяют  средний квадрат  ;

    6) определяют разность между средним  квадратом признака и квадратом  средней  .

    Рассмотрим  расчет дисперсии  в интервальном ряду распределения.

Порядок расчета дисперсии  взвешенной (по формуле  ):

  1. определяют среднюю арифметическую ;
  2. возводят в квадрат полученную среднюю ;
  3. возводят в квадрат каждую варианту ряда ;
  4. умножают квадраты вариант на частоты ;
  5. суммируют полученные произведения ;
  6. делят полученную сумму на сумму весов и получают средний квадрат признака ;
  7. определяют разность между средним значением квадратов и  квадратом средней арифметической, т.е. дисперсию .

1.4Показатели относительного рассеивания.

  Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах.  Они позволяют сравнивать характер рассеивания в различных распределениях  (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних,  при сравнении  разноименных  совокупностей). Расчет  показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к  средней  арифметической, умножаемое на 100%.

  1. Коэффициент  осцилляции  отражает  относительную колеблемость крайних значений признака вокруг средней.

  (1)

2. Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений от средней величины.

        (2)

    3. Коэффициент вариации.

        (3)

    Учитывая, что среднеквадратическое отклонение дает обобщающую характеристику колеблемости всех вариантов совокупности, коэффициент  вариации является  наиболее  распространенным  показателем колеблемости, используемым для оценки типичности средних величин.  При этом  исходят из того, что  если V больше 40 %, то это говорит о  большой колеблемости признака в  изучаемой совокупности.

1.4 Ряд распределения  или вариационный  ряд и его характеристики.

      Ряд распределения или  вариационный ряд – упорядоченное распределение единиц совокупности по возрастающим или по убывающим значениям признака и подсчет единиц с тем или иным значением признака. Построение рядов распределения (структурной группировки) является первым этапом изучения вариации и осуществляется  с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают типы рядов распределения.

      Если  за основу группировки взят качественный признак, то такой ряд распределения  называют атрибутивным (распределение  по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).

      Если  ряд распределения построен по количественному  признаку, то такой ряд называют вариационным. Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).

   Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

      Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака.

      Другие  формы вариационного  ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.

      Дискретный  ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.

      Если  признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость  основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить  интервальный вариационный ряд.

Величина  интервала определяется по формуле  , где

xmax, min - максимальное и минимальное значение признака, к – число групп.

      Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается , где к – число вариантов значения признака.

     Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.: ,  при этом

    Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда.

    В практике статистических исследований наиболее часто используются следующие закономерности распределения: нормальное распределение и распределение Пуассона.

   Нормальное распределение зависит от двух параметров: средней арифметической  и среднего квадратического отклонения. Его кривая выражается уравнением

      где у - ордината кривой нормального распределения;  - стандартизованные отклонения; е и π - математические постоянные; x - варианты вариационного ряда; - их средняя величина;  - cреднее квадратическое отклонение.

   Теоретические частоты при нормальном распределении определяются по формуле: , где N = Sf – сумма всех эмпирических частот вариационного ряда; h – величина интервала в группах.

    При помощи этой формулы мы получаем теоретическое (вероятностное) распределение, заменяя им эмпирическое (фактическое) распределение, по характеру они не должны отличаться друг от друга.

    Если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии ( ), такой ряд выравнивается по кривой Пуассона.

    Кривую Пуассона можно выразить отношением , где Px - вероятность наступления отдельных значений х; - средняя арифметическая ряда.   

   Теоретические частоты при распределении Пуассона определяют по формуле: f = N Px , где N – общее число единиц ряда.

      Для расчета обобщающих показателей  и для графического изображения  вариационных рядов с неравными  интервалами используют плотность  распределения, которая определяется по формулам:

       ,

      где - абсолютная плотность распределения в j-м интервале, - относительная плотность распределения в j-м интервале; ij – величина интервала.

    Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.

     Асимметрия распределения определяется на основе расчета коэффициента асимметрии, котрый является мерой несимметричности распределения. Если этот коэффициент отчетливо отличается от 0, распределение является асимметричным. Плотность нормального распределения симметрична относительно среднего.

     Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.

    Наиболее распространенным является критерий согласия К. Пирсона, который можно представить как сумму отношений квадратов расхождений между f' и f к теоретическим частотам: .

       Вычисленное значение критерия c2расч необходимо сравнить с табличным (критическим) значением c2табл. Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m - 3, где m - число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n ³ 50), при этом если в некоторых интервалах теоретические частоты меньше 5, то интервалы объединяют для условия больше 5.

      Если c2расч £ c2табл, то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.

      В том случае, если отсутствуют таблицы  для оценки случайности расхождения  теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского (КРом), который, используя величину c2, предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения: , где m - число групп; k = (m - 3 ) - число степеней свободы при исчислении частот нормального распределения.

      Если  вышеуказанное отношение < 3, то расхождения  эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение > 3, то расхождения  могут быть достаточно существенными  и гипотезу о нормальном распределении  следует отвергнуть.

    Критерий согласия А.Н. Колмогорова  используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле: , где D - максимальное значение разности между накопленными эмпирическими и теоретическими частотами; Sf - сумма эмпирических частот.

Информация о работе Понятие вариации и её видов