Группировка статистических данных и ее роль в анализе информации

Автор работы: Пользователь скрыл имя, 03 Октября 2010 в 21:24, Не определен

Описание работы

Контрольная работа

Файлы: 1 файл

Формулы.doc

— 566.50 Кб (Скачать файл)

Содержание

 

Семестр 1

   Группировка статистических данных и ее роль в анализе  информации

 

   Равный  интервал, величина интервала - , m – число групп

   Формула Стерджесса (величина интервала) - , n – число наблюдений

   Абсолютные, относительные, средние  величины

Относительные величины

   Относительные величины (ОВ) динамики характеризуют изменение явления во времени. (Коэффициент роста)

   Темп  роста – с переменной базой - yn – уровень явления за период (например, выпуск продукции по кварталам года)

   С постоянной базой - , yk – постоянная база сравнения

   ОВ  планового задания -

   ОВ  выполнения плана -

   ОВ  динамики -

   ОВ  структуры характеризуют долю отдельных частей в общем объеме совокупности (удельный вес) -

   ОВ  координации отражают отношение численности двух частей единого целого, т. е. показывают, сколько единиц одной группы приходится в среднем на одну, на 10 или на 100 единиц другой изучаемой совокупности.

   ОВ  координации -

   ОВ  наглядности (сравнения) отражают результаты сопоставления одноименных показателей, относящихся к одному и тому же периоду времени, но к разным объектам или территориям (например, сравнивается годовая производительность труда по 2-м предприятиям)

   ОВ  сравнения -

Средние величины

   Степенные средние общего типового расчета:

   Средняя степенная простая - , - индивидуальное значение признака, по которому рассчитывается средняя, n – объем совокупности (число единиц)

   Средняя степенная взвешенная - , fi – частота повторения индивидуального признака ( =n)

Значе-ние k Наименование  средней Формула средней
Простая Средняя
-1 Гармоническая ,
0 Геометрическая
1 Арифметическая ,
2 Квадратическая

    гарм. < геом < арифм < квадрат, x=w/f

   Гармоническая простая – когда небольшая  совокупность и индивидуальные значения не повторяются. Используется, если исчисляем среднюю из обратных величин.

   Средняя квадратическая – для расчета  среднего квадратического отклонения, являющегося показателем вариации признаков

   Средняя геометрическая простая – для  вычисления среднего коэффициента роста (темпа) в рядах динамики, если промежутки, к которым относятся коэффициенты роста, одинаковы.

Статистические  распределения и  их характеристики

   Мода – значение признака, которое наиболее часто встречается в совокупности

    , - нижняя граница модального интервала (интервал с наибольшей частотой), - величина интервала, - частота в модальном интервале.

   Медиана – значение признака, которое лежит в середине ранжированного ряда и делит этот ряд на две равные по численности части.

    - положение медианы

    , - нижняя граница медианного интервала, - накопленная частота интервала, предшествующего медианному, - частота медианного интервала.

   Квартель

    ,

    ,

   Дециль

    , (от 1/10 до 9/10) 
 

Показатели  вариации (колеблемости) признака

    Среднее линейное отклонение – на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.

    -для  несгруппированных данных (первичного  ряда):

    -для  вариационного ряда:

    Среднее квадратическое отклонение

    - для несгруппированных данных:

    - для вариационного ряда:

    Дисперсия

    - для несгруппированных данных:

    - для вариационного ряда:

    

    Коэффициент вариации (используется для характеристики однородности совокупности по исследуемому признаку)

     - до 17% – совокупность совершенно  однородна, 17%-33% - достаточно однородна, >33% - неоднородна.

Сложение  дисперсий

    Величина  общей дисперсии ( ) характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц данной совокупности

     , - общая средняя арифметическая для всей совокупности

    Межгрупповая  дисперсия ( ) отражает систематическую вариацию, т. е. различия в величине изучаемого признака, которые возникают под влиянием фактора, положенного в основу группировки

     , - средняя в каждой группе, - число единиц в каждой группе

    Средняя внутригрупповая  дисперсия ( ) характеризует случайную вариацию, возникающую под влиянием других, неучтенных факторов, и не зависит от условия (признака-фактора), положенного в основу группировки.

     , где  - дисперсия по отдельной группе

    или

    Равенство:

    Корреляционное  отношение

     , >0,5 – связь между групповым фактором и результирующим признаком – тесная, <0,5 – связь слабая

Показатель  асимметрии

     , - центральный момент третьего порядка

    Средняя квадратическая ошибка: , n – число наблюдений

    Если  , асимметрия существенна и распределение признака в генеральной совокупности не является симметричным. Если , асимметрия несущественна, ее наличие объясняется влиянием случайных обстоятельств.

     - правосторонняя асимметрия, - левосторонняя асимметрия.

Показатель  эксцесса (островершинности)

     , - центральный момент четвертого порядка

     >0 – высоковершинное,  < 0 – низковершинное ( = -2 – предел)

    Средняя квадратическая ошибка: n – число наблюдений

Кривые  распределения

    Кривая  линия, которая отражает закономерность изменения частот в чистом, исключающем  влияние случайных факторов виде, называется кривой распределения.

    Плотность распределения (расчет теоретических частот)

     , - нормированное отклонение

     , - определяется по таблице (приложение 1) 

    Критерий  согласия К. Пирсона (для проверки близости теоретического и эмпирического распределений, для проверки соответствия эмпирического распределения закону нормального распределения)

      f – эмпирические частоты в интервале, f – теоретические частоты в интервале 
 
 

    Критерий  согласия Романовского

     , m – число групп, m-3 – число степеней свободы при исчислении частот нормального распределения

    Если  к<3, то можно принять гипотезу о нормальном характере эмпирического распределения 

    Критерий  Колмогорова

     , D – максимальное значение разности между накопленными эмпирическими и теоретическими частотами, n – сумма эмпирических частот 

    Распределение Пуассона (теоретические  частоты)

         , n – общее число независимых испытаний, λ – среднее число появления редкого события в n одинаковых независимых испытаниях, m – частота данного события, е=2,71828 

Выборочное  наблюдение

    N – объем генеральной совокупности

    n – объем выборочной совокупности (число единиц, попавших в выборку)

     - генеральная средняя (среднее значение признака в генеральной совокупности)

     - выборочная средняя

    р – генеральная доля (доля единиц, обладающих данным признаком в генеральной  совокупности)

    w – выборочная доля

     - генеральная дисперсия

     - выборочная дисперсия

     - среднее квадратическое отклонение  признака в генеральной совокупности

    S – среднее квадратическое отклонение признака в выборочной совокупности. 

    Неравенство Чебышеба

    При неограниченном числе наблюдений, независящих  друг от друга из генеральной совокупности с вероятностью сколь угодно близкой  к 1, можно утверждать, что расхождение  между выборочной и генеральной  средней будет сколь угодно малой  величиной  .

    

    Теорема Ляпунова

    Дает  количественную оценку ошибки. При  неограниченном объеме из генеральной  совокупности с Р расхождения  выборочной и генеральной средней  равна интегралу Лапласа

     , - нормированная функция Лапласа (интеграл Лапласа) 

      Р – гарантированная вероятность

    t – коэффициент доверия, зависящий от Р 

      Р 0,683 0,954 0,997
      t 1 2 3

Информация о работе Группировка статистических данных и ее роль в анализе информации