Автор работы: Пользователь скрыл имя, 27 Ноября 2013 в 14:57, реферат
На практике, в большинстве случаев, для которых эта теория была разработана, совокупность, о которой мы хотим получить сведения, конечна и имеет четкие границы – жители города, станки на заводе, рыбы в озере. Иногда удобнее, казалось бы, получить нужные сведения, произведя сплошное обследование или перепись этой совокупности. Практические работники, привыкшие к сплошным переписям, сначала недоверчиво относились к выборочному методу и пользовались им неохотно. Хотя такого предубеждения более не существует, имеет смысл перечислить основные преимущества выборочного метода по сравнению со сплошной переписью.
Среднее значение признака. |
|
Доля признака. |
|
Стратифицированная выборка в любом случае оказывается точнее собственно-случайной. Этот метод особенно хорош, когда генеральная совокупность неоднородна. В этом случае собственно-случайный отбор крайне неэффективен (требует большого объема выборки).
Однако стратифицированная выборка может быть применена лишь при наличии дополнительной информации о генеральной совокупности (например, нам необходимо процентное соотношение мужчин и женщин, в случае, если мы хотим стратифицировать выборку по полу). Отсутствие такой информации делает применение стратифицированной выборки невозможным. Еще один недостаток стратифицированного отбора – это возможность систематической ошибки. Далее на примерах попытаемся проиллюстрировать различные способы применения стратифицированной выборки.
Пример: Возьмем опять данные о доходах из таблицы 1. Только теперь из этого же массива произведем не случайную, а стратифицированную выборку из четырех человек.
Для возможности проведения
стратифицированной выборки сделаем
допущение, что из предыдущей переписи
мы знаем доходы респондентов за предыдущий
период и имеем основания
На основании этих данных можно стратифицировать генеральную совокупность по доходу. Результаты этого деления представлены в таблице 12.
Таблица 12
Распределение респондентов по стратам.
№ группы. |
Респонденты, попавшие в группу. |
1. |
A,J,D. |
2. |
L,G,F. |
3. |
I,H,C. |
4. |
E,K,B. |
Здесь в каждой группе (или страте) находятся люди с максимально близкими доходами. Необходимые нам четыре человека мы отбираем путем случайного отбора одного человека из каждой группы (т.е. проводим пропорциональную выборку).
В итоге мы получаем вполне репрезентативную по доходу выборку, т.к. в нашей выборке будут в нужной пропорции представлены люди с различным материальным достатком.
Более того, подобный отбор является надежнее случайного, т.к. при таком отборе не могут быть выбраны «плохие» выборки, т.е. выборки, содержащие только бедных или богатых (например, ADJL или BCEK). Однако стратифицированная выборка не всегда приносит выгоду, что показано в следующем примере.
Пример: Допустим, что перед нами опять встала необходимость провести стратифицированную выборку из респондентов, представленных в таблице 1. Далее предположим, что за период между переписью и опросом доходы респондентов претерпели значительные изменения, то выделенные нами группы на основе данных переписи могут получиться не гомогенными (в одну страту попадут люди с разными доходами). Например, такими, которые представлены в таблице 13.
Таблица 13
Распределение респондентов по стратам
№ группы. |
Респонденты, попавшие в группу. |
1. |
A,F,C. |
2. |
L,J,D. |
3. |
K,E,G. |
4. |
H,B,I. |
В этом случае практически никакой выгоды по сравнению с собственно-случайной выборкой стратифицированный отбор не принесет, т.к. вероятность отбора нами плохих выборок сохранится и здесь.
Пример: Теперь рассмотрим случай с неоднородной генеральной совокупностью, т.е. совокупностью, в которой существуют отдельные резкие отклонения от средней тенденции. Например, генеральная совокупность, представленная в таблице 1, будет неоднородной, если, к примеру, респондент B вместо дохода в 6300 будет получать доход в 20000.
Стратифицировать в этом случае можно двумя путями: так, как было стратифицировано в таблице 12 и так, как это сделано в таблице 14.
Таблица 14
Распределение респондентов по стратам.
№ группы. |
Респонденты, попавшие в группу. |
1. |
A,J,D,L. |
2. |
G,F,I,H. |
3. |
C,E,K. |
4. |
B. |
В первом случае, как уже было сказано, был проведен пропорциональный отбор, а в данном случае - соответственно непропорциональный. Пропорциональный отбор в данном случае (в случае с неоднородной генеральной совокупностью) не годится, т.к. он не обеспечит однородность страт (в какую бы страту ни попал B, эта страта сразу же станет неоднородной).
Однако при непропорциональном отборе нарушается принцип равной вероятности попадания в выборку, т.к. респондент B попадает в нашу выборку при любом исходе.
Для исправления этого
обстоятельства при непропорциональном
отборе применяется процедура
Если отобрать все возможные выборки при данной стратификации (таб. 14), то без взвешивания мы получим смещенную выборочную оценку (генеральная средняя = 3817, а выборочная средняя = 6852). Однако если произвести взвешивание, то в данном случае непропорциональный отбор (стандартное отклонение = 277) будет эффективнее пропорционального (стандартное отклонение = 1878).
Пример:
Рассмотрим далее
Здесь нам на помощь может прийти стратифицированная выборка. Ее можно осуществить если нам удастся объединить несколько микрорайонов как сходные. Разделив все микрорайоны на несколько относительно однородных групп, можно построить репрезентативную выборку, не увеличивая ее объем.
Стратифицированная выборка может помочь нам и тогда, когда нет полного списка жителей города. В этом случае можно из каждой страты выбрать один микрорайон, в котором будет проводиться опрос, и собрать информацию о его жителях.
Однако если мы неправильно выберем критерии для объединения микрорайонов, то это приведет к серьезной систематической ошибке.
Здесь отбираются не люди, а группы. Группы отбираются случайным образом, а внутри них проводится сплошной опрос. Например, в ВУЗе с большим количеством студенческих групп отбор можно проводить путем случайного отбора этих групп и дальнейшего сплошного опроса в этих группах.
Формулы для расчета ошибки репрезентативности при гнездовом отборе даны в таблице 15.
Таблица 15
Формулы ошибки репрезентативности для стратифицированной выборки
Предмет изучения. |
Повторный отбор. |
Бесповторный отбор. |
Среднее значение признака. |
|
|
Доля признака. |
|
|
Где:
- межгрупповая дисперсия.
r – число групп в выборке.
- групповая средняя.
- общая средняя.
R – число групп в генеральной совокупности.
- межгрупповая доля.
Ясно, что доверительный интервал при гнездовой выборке будет меньше (выборка точней) при той же надежности чем при случайной, т.к. межгрупповая дисперсия меньше общей дисперсии.
Внутригрупповая дисперсия нам не нужна, т.к. мы опрашиваем все гнездо целиком и поэтому отклонения выборочного показателя от генерального внутри этой группы не имеем. Следовательно, нас должно волновать то, правильно ли мы выбрали сами группы. Поэтому мы и учитываем лишь межгрупповую дисперсию.
Формулы для вычисления объема выборки – преобразованные формулы ошибки репрезентативности. Они даны в следующей таблице.
Таблица 16.
Формулы для определения объема выборки при гнездовом отборе
Предмет изучения. |
Повторный отбор. |
Бесповторный отбор. |
Среднее значение признака. |
|
|
Доля признака. |
|
|
Разные источники по-разному оценивают точность гнездовой выборки по сравнению со случайной.
Главный «козырь» этого типа отбора в том, что он гораздо проще в организационном плане. Действительно, гораздо проще выбрать несколько групп и опросить их целиком, чем бегать за каждым респондентом. Это дает нам выигрыш в средствах и во времени.
Но при этом необходимо следить, чтобы количество групп в генеральной совокупности было достаточно большим, иначе ни о каком принципе случайности не может быть и речи. Более того, возможны перекосы из-за того, что на момент опроса не удается застать всех членов группы. К тому же объем выборки при гнездовом отборе обычно больше, чем при случайном отборе.
Классификация, которой мы будем придерживаться в данном докладе, строится на основе критериев, предложенных В.Э. Шляпентохом. Хотя эта классификация не является абсолютно строгой, и часто трудно провести границу между двумя методами, она отражает основные отличия методов и позволяет их некоторым образом структурировать. Основными факторами, определяющими природу неслучайного отбора, являются:
Классификация методов неслучайного отбора на основе названных факторов представлена в таблице 1.
Таблица 1
Классификация методов неслучайного отбора.
Факторы, определяющие природу неслучайного отбора |
Целенаправленность: контроль выборки исследователем: | |||
минимальный |
на среднем уровне |
максимальный | ||
Доступность: включение в выборку от респондента: |
не зависит |
А |
С |
E |
зависит |
В |
D |
X |
Рассмотрим подробнее каждый из типов неслучайного отбора.
Как следует из названия, в этом случае проводится отбор доступных единиц. Одним из плюсов этого метода являются сравнительно низкие издержки на поиск респондентов.
А: доступные респонденты выделены заранее;
В: респонденты выявляются в процессе опроса, поэтому действительное число доступных объектов определяется апостериори.
Сферы применения доступной выборки:
Информация о работе Выборочный метод в социальной статистике