Автор работы: Пользователь скрыл имя, 05 Сентября 2013 в 12:54, реферат
Исследование статистической совокупности с помощью выборочного метода предполагает получение ее характеристик не по всем единицам наблюдения, а по некоторой их части, сформированной в случайном порядке.
Источником информации для выборочного исследования является выборочное наблюдение, которое является одной из разновидностей несплошного наблюдения.
Целесообразность проведения выборочных исследований диктуется целым рядом обстоятельств.
Во-первых, оно существенно сокращает трудоемкость исследовательской работы как на получения исходной информации, так и на всех этапах последующей обработки.
Выборка
ВЫБОРОЧНОЕ ИССЛЕДОВАНИЕ
Исследование статистической совокупности с помощью выборочного метода предполагает получение ее характеристик не по всем единицам наблюдения, а по некоторой их части, сформированной в случайном порядке.
Источником информации для выборочного исследования является выборочное наблюдение, которое является одной из разновидностей несплошного наблюдения.
Целесообразность проведения выборочных исследований диктуется целым рядом обстоятельств.
Во-первых, оно существенно сокращает трудоемкость исследовательской работы как на получения исходной информации, так и на всех этапах последующей обработки.
Во-вторых, дает возможность проводить исследования в тех случаях, когда регистрация информации связана с порчей или уничтожением единиц наблюдения.
В-третьих, позволяет повысить точность исходной информации за счет организации ее сбора более квалифицированным персоналом по сокращенному числу единиц наблюдения.
В-четвертых, делает возможным исследования статистических совокупностей с неограниченным объемом.
Следует подчеркнуть, что применение выборочного метода не меняет цели исследования. Как и в любой статистической проблеме нас интересует характеристики всей совокупности, подлежащей изучению. Такую совокупность обычно называют генеральной. Однако в данном случае характеристики генеральной совокупности получают на основе предварительной оценки через аналогичные характеристики другой совокупности, которая имеет меньший объем и специально формируется из некоторых единиц, входящих в исходную (изучаемую) совокупность. Эту совокупность принято называть выборочной.
Очевидно, оценка генеральных характеристик на основе выборочных возможна только в том случае, если формируемая совокупность является репрезентативной, то есть достаточно хорошо отражающей те закономерности, которые имеются в генеральной совокупности.
Обеспечение репрезентативности основано на применении специальных методов отбора единиц из исходной совокупности, которые дают равную возможность (вероятность) быть выбранной любой единице.
Наиболее простым является метод отбора единиц без разделения исходной (генеральной) совокупности на части. Обычно он называется собственно случайным отбором. При его применении все единицы исходной совокупности перенумеровываются, после чего путем жеребьевки последовательно извлекаются одна за одной те единицы, которые будут включены в выборочную совокупность.
Проведение жеребьевки связано с большими трудозатратами и, кроме того, требуют применения специальных технических средств фишки, шапки, барабаны и т.д. Существенно упрощает вероятностный отбор использование таблиц случайных чисел или компьютерных датчиков случайных чисел.
Собственно-случайный отбор при любой технике его проведения должен обеспечить равную вероятность включения в выборку не только каждой единицы исходной совокупности, но и появление в выборке каждой возможной комбинации единиц. Строго говоря это условие может быть выполнено только в том случае, если объем исходной совокупности остается постоянным на всех этапах отбора единиц. Для этого отобранную единицу необходимо "возвращать" в исходную совокупность перед отбором следующей. Этот метод принято называть собственно-случайным повторным отбором. При повторном отборе одна и та же единица имеет возможность попасть в выборку несколько раз, что не всегда удобно для проведения исследования.
На практике чаще используют собственно-случайный бесповторный отбор, который предполагает исключение ранее выбранных единиц из исходной совокупности на всех последующих шагах выборки. При этом объем исходной совокупности постоянно уменьшается, что приводит к некоторому увеличению вероятности выбора для последующих единиц. Это обстоятельство надо учитывать при проведении выборочного исследования, особенно если объем исходной совокупности не очень велик.
Необходимо отметить, что собственно-случайный отбор нельзя заменить беспорядочным выбором единиц, при котором проявляется субъективное мнение составителя выборки. Недопустима также произвольная замена случайно отобранных единиц другими. Во всех этих случаях нарушаются требования репрезентативности и точность оценки характеристик исходной совокупности становится неопределенной.
Другая группа методов отбора предполагает разделение генеральной совокупности на части.
Механический отбор основан на расположении единиц в естественном порядке (географическом, пространственном, алфавитном, временном), выделении равных по объему частей и включении в выборку по одной определенной единице из каждой части.
Так, например, если составить алфавитный список всех студентов ВУЗа и выбрать каждого десятого из этого списка, то этот отбор будет механическим. Очевидно, механический отбор всегда является бесповторным. Выбирая случайным образом первую единицу, от которой с постоянным шагом будут отобраны все остальные, здесь можно обеспечить равную вероятность выбора для каждой единицы. Вместе с тем, появление различных комбинаций единиц в выборочной совокупности равную вероятность иметь не будет. Поэтому в некоторых ситуациях механический отбор может содержать систематическую ошибку. Вместе с тем, на практике им часто пользуются, поскольку его организация менее трудоемка.
Районированный (стратифицированный) отбор предполагает разделение единиц генеральной совокупности на отдельные группы с последующим случайным отбором единиц из каждой группы в отдельности. При этом число единиц, выбираемых из отдельных групп как правило пропорциональна объему этих групп.
Так, например, если устанавливается оценка среднего роста студентов ВУЗа, то целесообразно вначале разделить всех студентов на юношей и девушек и затем сделать выборку их этих двух групп пропорционально их численности. Ошибка выборки при этом окажется меньше, чем при собственно случайном отборе, за счет того, что вариация роста внутри групп юношей и девушек окажется меньше, чем общая вариация по всей совокупности студентов.
В районированном отборе также наблюдается некоторый отход от принципов равновероятного выбора. Вместе с тем, при использовании этого метода обеспечивается необходимое представительство в выборке различных групп, имеющихся в генеральной совокупности. Кроме того, указанные выше обстоятельства приводят в данном случае к понижению вариации исследуемого признака, что позволяет уменьшить потребный объем выборки.
Серийный (гнездовой) отбор также связан с разделением генеральной совокупности на группы, но в выборку здесь попадают не отдельные единицы из групп, а группы целиком. Причем выбор групп может быть организован случайным образом. В этом методе обеспечивается равная вероятность попадания различных групп (серий) и равная вероятность появления в выборке различных комбинаций серий.
Серийным отбором обычно пользуются в тех случаях, когда другие приемы трудноосуществимы. Так, например, при изучении заработной платы работающих в промышленности сложно составить полные списки занятых на всех промышленных предприятиях. В этом случае сначала реально выбрать случайным образом некоторое количество предприятий и включить в выборку всех занятых на них работников.
Многоступенчатый отбор осуществляется в несколько этапов, обычно с применением на каждом их них различных приемов выборки.
Примером такого подхода может служить выборочное обследование семейных бюджетов. При этом на первой ступени можно применить районированный отбор населенных пунктов с целью обеспечения представительства в выборке различных экономических районов страны. На второй ступени с помощью механического отбора устанавливаются районы внутри населенных пунктов, в которых будет проведено обследование. И, наконец, на третьей ступени применяется серийный отбор домохозяйств для регистрации бюджетов отдельных семей.
Математически постановка задачи выборочного исследования формулируется следующим образом:
Пусть предполагается исследовать распределение некоторого признака в генеральной совокупности известного объема . Целью исследования является получение оценки характеристик этого распределения, которые можно назвать генеральными. К их числу относятся:
– генеральная средняя ,
– генеральная доля ,
– генеральная дисперсия ,
– генеральное среднеквадратическое отклонение .
Если проводится сплошное наблюдения, то на основе полученной информации можно выполнить точный расчет эмпирических значений этих характеристик. Однако, предположим, что в данной ситуации это сделать невозможно или затруднительно.
Воспользуемся тогда выборочным методом и для этого методом повторного собственно случайного отбора сформируем из генеральной совокупности выборочную объемом . Очевидно .
По зарегистрированным значениям признака у единиц выборочной совокупности могут быть рассчитаны соответствующие характеристики:
– выборочная средняя ,
– выборочная доля ,
– выборочная дисперсия ,
– выборочная среднеквадратическое отклонение .
Возникает вопрос о том как на основе известных выборочных характеристик оценить значения искомых генеральных характеристик ? Для ответа на этот вопрос можно применить два подхода. Первый из них основан на предположении о примерном равенстве соответствующих выборочных и генеральных характеристик. Если отбор единиц был корректен и объем выборки достаточно велик, то то на основе закона больших чисел можно доказать, что:
То есть, значения полученных выборочных характеристик можно использовать в роли приблизительных оценок генеральных. Поскольку каждая из этих оценок представлена одним числом, то такие значения обычно называют точечными оценками генеральных характеристик.
Второй подход предполагает использование интервальных оценок, с помощью которых утверждается. что искомая генеральная характеристика находится внутри некоторого интервала значений. Так, например, одна из таких оценок может утверждать, что генеральная средняя находится внутри интервала . Или другими словами ее истинное значение оказывается не меньше, чем , и не больше .
Уточним способы получения точечных оценок по данным выборочной совокупности.
– выборочная средняя ( )
,
где
– вариант значений признака, встречающиеся в выборке,
– число значений в выборке по варианту (частота),
– объем выборочной совокупности.
Нахождение средних значений наиболее типично для количественных признаков. Так, если в ходе исследования устанавливается уровень цены рабочей силы, то для этого необходимо сформировать выборочную совокупность из числа наемных работников. Далее может быть зарегистрирована заработная плата каждого из отобранных работников и рассчитано ее среднее значение. Полученная таким образом выборочная средняя является точечной оценкой цены рабочей силы по всей совокупности работающих.
– выборочная доля ( )
,
где
– число единиц в выборке, отвечающих некоторому заданному условию.
Чаще всего необходимость оценки доли возникает при исследовании альтернативных признаков, у которых имеется только два возможных значения или состояния. Так, если изучаются вопросы занятости населения с точки зрения распространенности работы по совместительству, то можно сформировать выборочную совокупность из работников предприятий и организаций, установить численность совместителей в этой выборке и рассчитать их выборочную долю. Полученное значение можно рассматривать как точечную оценку генеральной доли совместителей среди всех работающих.
– выборочная дисперсия ( )
.
Этот вариант выборочной дисперсии используется для характеристики вариации количественных признаков.
Точечная оценка генеральной дисперсии через известное значение выборочной дисперсии имеет свои особенности. Математически можно доказать, что выборочная дисперсия является смещенной оценкой, то есть ее математическое ожидание оказывается несколько меньше генеральной дисперсии. Ниже будет приведено строгое доказательство этого утверждения. Для того чтобы получить несмещенную оценку генеральной дисперсии необходимо применить к выборочной определенный поправочный коэффициент:
, где – объем выборочной совокупности.
Очевидно, чем больше объем выборки, тем величина поправочного коэффициента становится ближе к единице. Поэтому на практике при достаточно большом объеме выборки поправку к выборочной дисперсии можно не делать.
– выборочное среднеквадратическое отклонение ( )