Автоматизированный априорный анализ статистической совокупности в среде MS Excel

29 Октября 2010, автор: пользователь скрыл имя

Описание работы

Лабораторная работа

Скачать архив (102.13 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

ОТЧЕТ.doc

— 408.50 Кб (Скачать файл)

На основе данных табл.9 структура рассеяния значений признака по трем диапазонам (графы 5 и 6) сопоставляется со структурой рассеяния по правилу «трех сигм», справедливому для нормальных и близких к нему распределений:

68,3% значений располагаются в диапазоне (),

95,4% значений располагаются в диапазоне (),

99,7% значений располагаются в диапазоне ().

Если полученная в табл. 9 структура рассеяния х_i по 3-м диапазонам незначительно расходится с правилом «трех сигм», можно предположить, что распределение единиц совокупности по данному признаку близко к нормальному.

Расхождение с правилом «трех сигм» может быть существенным. Например, менее 60% значений х_i попадают в центральный диапазон () или значительно более 5% значения х_i выходит за диапазон (). В этих случаях распределение нельзя считать близким к нормальному.

Вывод:

Сравнение данных графы 5 табл.9 с правилом «трех сигм» показывает на их незначительное расхождение, следовательно, распределение единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов можно считать близким к нормальному.

Сравнение данных графы 6 табл.9 с правилом «трех сигм» показывает на незначительное расхождение, следовательно, распределение единиц совокупности по признаку Выпуск продукции можно считать близким к нормальному.

Задача 4. Для ответа на вопросы 4а) – 4в) необходимо воспользоваться табл.8 и сравнить величины показателей для двух признаков.

Для сравнения степени колеблемости значений изучаемых признаков, степени однородности совокупности по этим признакам, надежности их средних значений используются коэффициенты вариации V_s признаков.

Вывод:

Так как V_s для первого признака меньше, чем V_s для второго признака, то колеблемость значений первого признака меньше колеблемости значений второго признака, совокупность более однородна по первому признаку, среднее значение первого признака является более надежным, чем у второго признака.

Задача 5. Интервальный вариационный ряд распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов представлен в табл.7, а его гистограмма и кумулята – на рис.2.

Таблица 7

Группа предприятий по стоимости основных фондов	Число предприятий в группе	Накопленная частость группы.%
485	4	13,33%
575	5	30,00%
665	11	66,67%
755	7	90,00%
845	3	100,00%
Итого		100,00%

Рис.2

Возможность отнесения распределения признака «Среднегодовая стоимость основных производственных фондов» к семейству нормальных распределений устанавливается путем анализа формы гистограммы распределения. Анализируются количество вершин в гистограмме, ее асимметричность и выраженность «хвостов», т.е. частоты появления в распределении значений, выходящих за диапазон ().

1. При анализе формы гистограммы прежде всего следует оценить распределение вариантов признака по интервалам (группам). Если на гистограмме четко прослеживаются два-три «горба» частот вариантов, это говорит о том, что значения признака концентрируются сразу в нескольких интервалах, что не соответствует нормальному закону распределения.

Если гистограмма имеет одновершинную форму, есть основания предполагать, что выборочная совокупность может иметь характер распределения, близкий к нормальному.

2. Для дальнейшего анализа формы распределения используются описательные параметры выборки – показатели центра распределения (, Mo, Me) и вариации (). Совокупность этих показателей позволяет дать качественную оценку близости эмпирических данных к нормальной форме распределения.

Нормальное распределение является симметричным, и для него выполняются соотношения:

=Mo=Me

Нарушение этих соотношений свидетельствует о наличии асимметрии распределения. Распределения с небольшой или умеренной асимметрией в большинстве случаев относятся к нормальному типу.

3. Для анализа длины «хвостов» распределения используется правило «трех сигм». Согласно этому правилу в нормальном и близким к нему распределениях крайние значения признака (близкие к х_min и х_max) встречаются много реже (5-7 % всех случаев), чем лежащие в диапазоне (). Следовательно, по проценту выхода значений признака за пределы диапазона () можно судить о соответствии длины «хвостов» распределения нормальному закону.

Вывод:

1. Гистограмма является одновершинной.

2. Распределение приблизительно симметрично , так как параметры , Mo, Me отличаются незначительно:

=617, Mo=642, Me=626.

3. “Хвосты” распределения не очень длинны, т.к. согласно графе 5 табл.9 96,6% вариантов лежат за пределами интервала ()=(394;841) млн. руб.

Следовательно, на основании п.п. 1,2,3, можно сделать заключение о близости изучаемого распределения к нормальному.

II. Статистический анализ генеральной совокупности

Задача 1. Рассчитанные в табл.3 генеральные показатели представлены в табл.10.

Таблица 10

Описательные статистики генеральной совокупности

Обобщающие статистические показатели совокупности по изучаемым признакам	Признаки
	Среднегодовая стоимость основных производственных фондов	Выпуск продукции
Стандартное отклонение , млн. руб.	109,6513186	129,4670037
Дисперсия	12023,41167	16761,70504
Асимметричность As	-0,097873275	0,113788704
Эксцесс Ek	-0,444289524	-0,196785132

Для нормального распределения справедливо равенство

R_N=6s_N.

В условиях близости распределения единиц генеральной совокупности к нормальному это соотношение используется для прогнозной оценки размаха вариации признака в генеральной совокупности.

Ожидаемый размах вариации признаков R_N:

- для первого признака R_N =72140,

- для второго признака R_N =10057.

Соотношение между генеральной и выборочной дисперсиями:

- для первого признака 0,96, т.е. расхождение между дисперсиями незначительное;

-для второго признака 0,96, т.е. расхождение между дисперсиями незначительное.

Задача 2. Применение выборочного метода наблюдения связано с измерением степени достоверности статистических характеристик генеральной совокупности, полученных по результатам выборочного наблюдения. Достоверность генеральных параметров зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности.

Как правило, статистические характеристики выборочной и генеральной совокупностей не совпадают, а отклоняются на некоторую величину ε, которую называют ошибкой выборки (ошибкой репрезентативности). Ошибка выборки – это разность между значением показателя, который был получен по выборке, и генеральным значением этого показателя. Например, разность

= |-|

определяет ошибку репрезентативности для средней величины признака.

Так как ошибки выборки всегда случайны, вычисляют среднюю и предельную ошибки выборки.

1. Для среднего значения признака средняя ошибка выборки (ее называют также стандартной ошибкой) выражает среднее квадратическое отклонение s выборочной средней от математического ожидания M[] генеральной средней .

Для изучаемых признаков средние ошибки выборки даны в табл. 3:

- для признака Среднегодовая стоимость основных производственных фондов

=21,1024061,

- для признака Выпуск продукции

=24,91593647.

2. Предельная ошибка выборки определяет границы, в пределах которых лежит генеральная средняя . Эти границы задают так называемый доверительный интервал генеральной средней – случайную область значений, которая с вероятностью P, близкой к 1, гарантированно содержит значение генеральной средней. Эту вероятность называют доверительной вероятностью или уровнем надежности.

Для уровней надежности P=0,954; P=0,683 оценки предельных ошибок выборки даны в табл. 3 и табл. 4.

Для генеральной средней предельные значения и доверительные интервалы определяются выражениями:

Предельные ошибки выборки и ожидаемые границы для генеральных средних представлены в табл. 11.

Таблица 11

Предельные ошибки выборки и ожидаемые границы для генеральных средних

Доверительная вероятность Р	Коэффи-циент доверия t	Предельные ошибки выборки, млн. руб.		Ожидаемые границы для средних , млн. руб.
Доверительная вероятность Р	Коэффи-циент доверия t	для первого признака	для второго признака	для первого признака	для второго признака
0,683	1	21,51455602	25,40256824	-2121,69	-2525,6
0,954	2	44,14077633	52,11769566	-43,7844,49	-51,6752,56

Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Описание работы

Файлы: 1 файл

ОТЧЕТ.doc

Таблица 10

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Связанные документы