Автор работы: Пользователь скрыл имя, 05 Сентября 2013 в 12:54, реферат
Исследование статистической совокупности с помощью выборочного метода предполагает получение ее характеристик не по всем единицам наблюдения, а по некоторой их части, сформированной в случайном порядке.
Источником информации для выборочного исследования является выборочное наблюдение, которое является одной из разновидностей несплошного наблюдения.
Целесообразность проведения выборочных исследований диктуется целым рядом обстоятельств.
Во-первых, оно существенно сокращает трудоемкость исследовательской работы как на получения исходной информации, так и на всех этапах последующей обработки.
интервальная оценка генеральной доли .
2. Определять доверительную вероятность того, что генеральная характеристика отличается от выборочной не более, чем на некоторую заданную величину.
известны:
объем генеральной совокупности
объем выборочной совокупности
допустимые ошибки выборочных характеристик и
искомые значения:
доверительные вероятности и .
3. Устанавливать необходимый объем выборки, который с известной доверительной вероятностью обеспечивает заданную точность выборочных характеристик.
известны:
объем генеральной совокупности
допустимые ошибки выборочных характеристик и
доверительные вероятности и
искомое значение:
объем выборочной совокупности .
Решение первой задачи основано на вычислении доверительных пределов генеральных характеристик.
Пусть задана требуемая степень надежности (доверительная вероятность) искомой интервальной оценки генеральной средней – . На основе формирования и обработки выборочной совокупности получено значение и выборочной дисперсии и выборочной средней , а также рассчитана ее среднеквадратическая ошибка . Тогда, доверительные пределы генеральной средней будут равны:
где – коэффициент доверия, устанавливаемый по таблице удвоенных значений функции Лапласа в соответствии с заданной доверительной вероятностью.
Исходя из полученных таким образом доверительных пределов, можно установить интервальную оценку генеральной средней:
Заметим, что последовательность решения этой задачи не зависит от метода отбора единиц. Различие состоит только в использовании соответствующей формулы для расчета среднеквадратической ошибки выборки.
Аналогичным образом может быть сформулирована и решена задача нахождения интервальной оценки генеральной доли:
Проиллюстрируем решение первой задачи числовым примером.
Предположим, что необходимо установить интервальную оценку среднего процента дивидендов для 250 акционерных обществ – , зарегистрированных в некотором городе, с доверительной вероятностью 0,95 – = 0,95. Методом собственно случайного повторного отбора была сформирована выборка из 50 акционерных обществ – , по которым зарегистрировано значение исследуемого показателя, выполнена группировка и построен следующий ряд распределения:
Выборочное распределение АО
по проценту дивидендов
№ группы |
Процент дивидендов |
Число АО |
Накопленная доля АО |
1 |
0 – 2 |
9 |
0,18 |
2 |
2 – 4 |
12 |
0,42 |
3 |
4 – 6 |
11 |
0,64 |
4 |
6 – 8 |
9 |
0,82 |
5 |
8 – 10 |
6 |
0,94 |
6 |
10 – 12 |
3 |
1,00 |
Всего |
50 |
– |
Заметим, что выборочный ряд распределения в некоторой степени отличается от нормального в силу его асимметрии. Можно предположить, что и в генеральной совокупности распределение этого признака также имеет некоторую правостороннюю асимметрию. Несмотря на это, при условии проведения серии выборок и построения ряда распределения для выборочных средних можно было бы убедиться, что этот производный ряд приближается к нормальному.
Определим выборочные характеристики.
Вспомогательные расчеты для нахождения выборочных характеристик
№ группы |
|
|
|
|
|
1 |
1 |
9 |
9 |
1 |
9 |
2 |
3 |
12 |
36 |
9 |
108 |
3 |
5 |
11 |
55 |
25 |
275 |
4 |
7 |
9 |
63 |
49 |
441 |
5 |
9 |
6 |
54 |
81 |
486 |
6 |
11 |
3 |
33 |
121 |
363 |
– |
50 |
250 |
– |
1682 |
– выборочная средняя
– выборочная дисперсия
– среднеквадратическая ошибка
выборочной средней
По таблице удвоенных значений функции Лапласа можно установить, что заданной доверительной вероятности соответствует значение коэффициента доверия . Теперь легко установить доверительные пределы генеральной средней:
Наконец, определяется интервальная оценка генеральной средней:
Таким образом, на основе выборочного исследования с вероятностью 0,95 можно утверждать, что средний процент дивидендов по всем 250 зарегистрированным акционерным обществам находится в пределах от 4,2 до 5,8 %.
Попробуем теперь выяснить какой удельный вес среди всех акционерных обществ города приходится на те, у которых процент дивидендов оказывается менее 4 %.
По графе накопленных частостей можно установить, что соответствующая выборочная доля равна 0,42 ( ). Рассчитаем среднеквадратическую ошибку этой характеристики:
Тогда при той же степени надежности доверительные пределы генеральной доли будут равны
Интервальная оценка генеральной доли:
Следовательно, с вероятностью 0,95 можно утверждать, что среди всех акционерных обществ удельный вес имеющих дивиденды менее 4 % составляет 0, 0,28 до 0,56.
Предположим теперь, что в том же примере формирование выборочной совокупности производилось методом собственно случайного бесповторного отбора. При этом по выборке был получен аналогичный ряд распределения, характеристики которого (выборочная средняя, выборочная доля, выборочная дисперсия) совпадают с ранее полученными.
Рассчитаем в этих условиях среднеквадратические ошибки выборки:
– для выборочной средней
– для выборочной доли
Тогда при той же доверительной вероятности ( ) интервальные оценки будут иметь следующий вид:
– для выборочной средней
– для выборочной доли
Интерпретация полученных интервальных оценок может быть сделана по аналогии с предшествующим методом отбора единиц.
Обратим внимание на то, что при одной и той же исходной информации применение бесповторного отбора дало меньшие ошибки выборки, чем для повторного отбора. Как следствие, интервальные оценки при этом оказались уже. Это позволяет сделать вывод, что бесповторный отбор позволяет в одинаковых условиях (одна и та же генеральная совокупность, одинаковый объем выборки, равная доверительная вероятность) более точно провести исследование, чем при повторном отборе.
Можно привести еще одно обстоятельство, говорящее в пользу применения бесповторного метода. Рассмотрим предельный случай отбора, в котором объем выборочной совокупности совпадает с объемом генеральной. В этих условиях использование повторного метода не гарантирует полного совпадения состава выборочной и генеральной совокупности, так как в выборку отдельные единицы могут попасть несколько раз, а некоторые ни разу. Эти различия в составе приведут к тому, что выборочные характеристики будут отличаться от генеральных.
В тех же условиях использование бесповторного метода обеспечит однократное включение в выборку всех единиц генеральной совокупности и получение значений выборочных характеристик идентичных генеральным.
Вторая задача выборочного исследования предполагает нахождение доверительной вероятности по заданной (допустимой) ошибки выборки.
Пусть из генеральной совокупности объема сформирована выборка объемом , для которой определены выборочные характеристики , , . Необходимо установит вероятность того, что выборочная средняя (выборочная доля) не отклонится от генеральной в ту или иную сторону более, чем на заданную величину ( ).
Искомая доверительная вероятность определяется удвоенной функцией Лапласа от коэффициента доверия , значение которого может быть установлено из соотношения:
Среднеквадратическая ошибка определяется по соответствующей формуле для конкретного метода отбора единиц. Например, при собственно случайном бесповторном отборе ее величина равна:
Тогда можно записать:
Используя полученное выражение в качестве аргумента соответствующей функции, можно получить развернутое выражение для определения искомой вероятности:
Аналогичным образом определяется доверительная вероятность для оценки генеральной доли:
Пусть, для рассмотренного выше примера необходимо определить вероятность того, что средний процент дивидендов по всем акционерным обществам города не отклонится от установленной по выборке величины более, чем на . Зная, что выборка была бесповторной, определяем:
При определении этого результата используется таблица значений функции Лапласа, имеющаяся в статистической справочной литературе.
Выполненный расчет позволил установить, что вероятность нахождения среднего процента дивидендов по всем акционерным обществам в интервале от 4 до 6 %, равна 0,993.
Теперь оценим в рассматриваемом примере вероятность того, что доля акционерных обществ города, выплачивающих дивиденды менее 4 %, находится в пределах ( , ). Для случая бесповторного отбора имеем:
В общем случае для любого метода отбора единиц справедливы следующие равенства:
При использовании этих равенств для определения вероятности необходимо лишь правильно выбрать формулу расчета среднеквадратической ошибки , соответствующую принятому методу отбора единиц наблюдения.
Третья задача выборочного исследования связана с обоснованием необходимого объема выборки, позволяющей обеспечить требуемую точность оценки генеральных характеристик с заданной доверительной вероятностью.
Пусть предполагается провести исследование некоторого признака в генеральной совокупности объема . При этом необходимо добиться того, чтобы ошибка выборочной характеристики не превышала некоторой величины с доверительной вероятностью . Какого объема для этого должна быть сформирована выборочная совокупность?
Предположим сначала, что выборка будет производиться на основе собственно случайного повторного отбора, для которого справедлива следующая формула расчета среднеквадратической ошибки выборочной средней:
Известно также, что: и, следовательно .
Тогда можно записать равенство
Решая это равенство относительно , несложно получить формулу для расчета необходимого объема выборочной совокупности:
На основе аналогичных рассуждений и преобразований можно получить расчетную формулу для определения необходимого объема выборки при использовании бесповторного метода: