Понятие о статистике и краткие сведения из ее истории

Автор работы: Пользователь скрыл имя, 06 Февраля 2011 в 18:07, лекция

Описание работы

Термин статистика (от лат. status) означает «определенное положение вещей». От этого корня возникли слова «stato» (государство). «statista» (статистик - знаток государства), «statistica» (статистика - определенная сумма знаний, сведений о государстве).

Файлы: 1 файл

2_Лекционный комплекс.doc

— 548.00 Кб (Скачать файл)

    Групповые средние отличаются одна от другой и от общей средней, т.е. варьируют. Их вариацию называют межгрупповой вариацией. Для ее характеристики исчисляют  средний квадрат отклонений групповых средних от общей средней: 

где j групповые средние,  – общая средняя,    nj – число единиц в группе.

    Межгрупповая  дисперсия (дисперсия групповых средних) измеряет вариацию результатного признака за счет факторного признака, положенного в основании группировки.

    При сравнении колеблемости различных  признаков в одной и той  же совокупности или же при сравнении  колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической пользуются относительными показателями вариации.

    Эти показатели вычисляются как отношение  абсолютных показателей вариации к  средней арифметической (или медиане)

      Коэффициент вариации

      Относительное линейное отклонение

      Коэффициент осцилляции 

    Наиболее  часто применяемый показатель относительной  колеблемости – коэффициент вариации, который показывает среднее отклонение от среднего значения признака в процентах.

    Его используют для: сравнительной оценки вариации; характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%, т.е. меньше 33%. 

Законы  вариации.

Закон вариации индивидуальных значений признака или «правило трех сигм». Бельгийский статистик А.Кетле обнаружил, что вариации некоторых массовых явлений подчиняются закону распределения ошибок, открытому К.Гауссом и П. Лапласом почти одновременно. Кривая, отображающая это распределение, имеет вид колокола     (рис.2).

По  нормальному закону (термин предложен английским статистиком К.Пирсоном) распределения колеблемость индивидуальных значений признака находится в пределах (правило трех сигм).

    Нормальному закону распределения подчиняются естественные свойства человека (рост, вес, физическая сила), характеристики промышленных изделий (размер, вес, электрическое сопротивление, упругость и т.п.). В сфере быстроизменяющихся общественных явлений действие этого закона проявляется сравнительно редко. Однако, в ряде случаев, использование правила трех сигм практически возможно.

   Закон вариации средних  величин.  Вариация средних величин меньше вариации индивидуальных значений признака. Средние значения признака изменяются в пределах: , где n – число единиц.
 

3. Моменты. Ассиметрия  и эксцесс

    Моменты – обобщающие характеристики, определяющие характер распределения.

Различают начальные, начальные относительно (условные), и центральные моменты. Начальные моменты : . Центральные моменты ( ): . Центральный момент используется для числового измерения ассиметрии , которая определяется как отношение: = . Ассиметрия характеризует «скошенность» распределения. Величина показателя может быть положительной (рис.3 б) и отрицательной (рис.3 а).

(островершинности).

Для симметричных распределений рассчитывается показатель эксцесса Эксцессом называется величина: -3, которая характеризует островершинность или плосковершинность  распределения, так называемую «крутость».

Для нормального  закона =3, таким образом =0.  Распределения более островершинные, чем нормальное, обладают положительным эксцессом, более плосковершинные – отрицательным эксцессом. На рис. 4 представлены островершинное (величина эксцесса положительная) и плосковершинное (величина эксцесса отрицательная) распределения.  

4. Законы распределения

Законы  распределения являются обобщающей характеристикой вариации в однородной совокупности.

Нормальное  распределение. Распределение признака в совокупности называется нормальным, если этот признак представляет собой результат воздействия многочисленных и многообразных факторов, которые мало связаны друг с другом и влияние каждого из них незначительно по сравнению с общим  влиянием всех факторов. Аналитически нормальное распределение описывается следующим образом: . 

  1. Понятие выборочного наблюдения, его задачи

  Выборочное наблюдение - такое несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются не все единицы изучаемой совокупности, а лишь часть, отобранная в определенном порядке. Наблюдение организовано таким образом, что эта часть отобранных единиц в уменьшаемом масштабе репрезентирует (представляет) всю совокупность.

     Преимущества выборочного наблюдения: экономия времени и средств в результате сокращения объема работы; сведение к минимуму порчи или уничтожения исследуемых объектов (определение прочности пряжи при разрыве, испытание электрических лампочек на продолжительность горения и т.п.); достижение большей точности результатов обследования благодаря сокращению ошибок, происходящих при регистрации.

    Выборочное  наблюдение следует проводить в  строгом соответствии с научными принципами теории выборочного метода. Такими принципами являются: обеспечение случайности (равной возможности попадания в выборку) отбора единиц и достаточного их числа. Соблюдение этих принципов позволит получить достаточную гарантию репрезентативности полученной выборочной совокупности. Понятие репрезентативности отобранной совокупности означает: ее представительство в отношении тех признаков, которые изучаются или оказывают существенное влияние на формирование сводных обобщающих характеристик.

    Основная  задача выборочного  наблюдения состоит в том, чтобы на основе характеристик выборочной совокупности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности.

    Однако, при любых статистических исследованиях (сплошных и выборочных) возникают  ошибки двух видов: регистрации и репрезентативности.

    Ошибки  регистрации  могут иметь случайный (непреднамеренный) и систематический (тенденциозный) характер. Случайные ошибки обычно уравновешивают друг друга, т.к. не имеют преимущественного направления в сторону преувеличения или снижения значения изучаемого показателя. Систематические ошибки направлены в одну сторону, вследствие преднамеренного нарушения правил отбора (предвзятые цели). Их избегают при правильной организации и проведении наблюдения.

    Ошибки  репрезентативности присущи только выборочному наблюдению и возникают вследствие того, что выборочная совокупность не полностью воспроизводит генеральную. Они представляют собой расхождение между величинами выборочных и соответствующих генеральных показателей.

    Характеристики генеральной и выборочной совокупностей. Совокупность отобранных единиц называют выборочной совокупностью, а совокупность единиц, из которых производится отбор, - генеральной совокупностью.

    Генеральная и выборочная совокупности характеризуются  своими показателями: долей, средним размером признака, дисперсией и др. Доля единиц, обладающих тем или иным признаком в генеральной совокупности, называется генеральной долей и обозначается p. Выборочная доля обозначается через w. Выборочная доля называется также частостью.

    Средний размер в генеральной совокупности называют генеральной средней и  обозначают , средний размер в выборочной совокупности – выборочной средней, обозначаемой .

    С определенной вероятностью можно судить о величине разности между генеральными и выборочными характеристиками на основе предельных теорем.  Предельные теоремы исходят из нормального распределения величин. Нормальное распределение показывает, что большая часть величин сосредотачивается около генеральной средней. Около 68,3% численности выборочных средних не будет выходить за пределы генеральной средней; 95,4% этой численности будет заключено в пределах и 99,7% их не выйдет за пределы . Нормальное распределение имеет довольно общий характер и показывает частоту появления ошибок данного размера средней. 

  1. Определение ошибок выборочного  наблюдения при различных  видах выборки

Расхождение между выборочной средней и генеральной средней. Теорема Чебышева-Ляпунова. Расхождения между выборочными и генеральными характеристиками называют ошибками.

    Теорема Чебышева применительно к выборочному  наблюдению утверждает, что ошибка репрезентативности – разность между  выборочной средней и генеральной средней – при достаточно большом числе наблюдений будет сколь угодно малой, т.е. ,

    где - абсолютная величина расхождения между генеральной средней и выборочной средней, составляющая ошибку репрезентативности;

     - среднее квадратическое отклонение  вариантов выборочной средней  от генеральной средней (средняя  ошибка выборки). Оно зависит от  колеблемости признака в генеральной  совокупности  и числа отобранных единиц n: . Эта запись показывает, что о величине расхождения можно судить лишь с определенной вероятностью, которая зависит от коэффициента доверия t. Если выбрать t=2, то вероятность того, что это расхождение не превысит , будет не меньше чем 0,75, если  t=3, то вероятность превысит 0,89 и т.д.

    Теорема была доказана П.Л. Чебышевым только для независимых событий, т.е. производстве повторной выборки. Позднее академиком А.А. Марковым было доказано сохранение этого условия для зависимых событий (бесповторной выборки).

    Академик  А.М. Ляпунов доказал, что вероятность  отклонений выборочной средней от генеральной  средней при достаточно большом  числе отобранных единиц подчиняется  закону нормального распределения. Из теоремы Ляпунова следует, что вероятность этих отклонений при разных значениях t может определяться по формуле:

    Значения  этого интеграла при разных значениях  t табулированы и даются в специальных таблицах. Вероятность для некоторых t (из таблицы):

при t=1 F(t)=0,683, при t=1,5 F(t)=0,866,

при t=2 F(t)=0,954, при t=2,5 F(t)=0,988,

при t=3 F(t)=0,997, при t=3,5 F(t)=0,999.

    Доверительное число t указывает, что расхождение не превысит кратную ему среднюю ошибку выборки . Если t=1, то расхождение между выборочной средней и генеральной средней не превысит . Это может быть прочитано и так: с вероятностью 0,683 можно утверждать, что разность между выборочной и генеральной средними не превысит одной величины средней ошибки выборки. Другими словами, в 683 случаях из 1000 ошибка репрезентативности не выйдет за пределы . С вероятностью 0,997 (довольно близкой к единице) можно ожидать, что разность между выборочной и генеральной средними не превзойдет трехкратной средней ошибки выборки.

    Средняя ошибка выборки  показывает, какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Величина , обозначаемая , называется предельной ошибкой выборки, которая определяется формулой . С увеличением t увеличивается вероятность и величина ошибки.

    Предельная  ошибка выборки позволяет определять предельные значения характеристик генеральной совокупности при заданной вероятности и их доверительные интервалы     

    Генеральная  средняя ( ) отличается от выборочной средней ( ) на   величину предельной ошибки выборки: 

      Это означает: с заданной вероятностью можно утверждать, что значение генеральной средней можно ожидать в пределаx от до , то есть что доверительные интервал ( ) с заданной вероятностью заключает в себе генеральную среднюю.

Информация о работе Понятие о статистике и краткие сведения из ее истории