Автор работы: Пользователь скрыл имя, 05 Декабря 2011 в 17:00, курсовая работа
Основная цель данной курсовой работы – решение некоторых экономических задач с помощью статистического пакета StatGraphics.
Для достижения поставленной цели необходимо решить следующие задачи:
1. Изучить и систематизировать литературу по статистическим методам обработки информации.
2. Изучить пакет StatGraphics.
В первом столбце стоят числа – накопительные количества, насчитываемые сверху от первого интервала до медианного и от последнего интервала снизу до медианы. Кумуляты нарастают к медианному интервалу, характеризуя ствол дерева выборки.
Форма Confidence Intervals (Доверительные интервалы) выводит интервалы возможных значений математического ожидания и среднеквадратичного отклонения с доверительной вероятностью не менее 95%. Ее величина изменяется посредством вызова контекстного меню и выбора в нем команды Pane Option…, выводящее окно для ввода доверительной вероятности.
Форма Hypothesis Tests (проверка гипотез) отображает результаты проверки тремя методами гипотез о значимости отклонений среднего и медианы от нуля (по умолчанию) или другого значения, задаваемого посредством контекстного меню и выбора в нем команды Pane Option…, выводящее диалоговое окно для ввода доверительной вероятности и сопоставляемого значения. Нулевая (проверяемая гипотеза) может заключаться в том, что среднее и медиана не равны введенному значению, больше или меньше его.
В
форме Percentilies
(Процентили), показанной в левой части
рисунка 7, - значения случайной величины
для указанных процентов объема выборки:
60 для 5%, 71 для 10% т. д. Проценты для выводимых
значений случайной величины можно изменить
в окне, которое появляется при вызове
контекстного меню.
Рисунок
7 Рабочее окно STATGRAPHICS
с диаграммой BOX- and- WHISKER
Plot
3.5. Опции графического представления данных.
Встроенные графики в STATGRAPHICS выбираются из списка, который вызывается в окне Variable Analysis- Col_1 щелчком по пиктограмме Graphical Options. Для выбора графика достаточно установить флажок на названии и нажать кнопку OK . График выводится в правую часть окна Variable Analysis- Col_1, но может быть расширен на все окно, если убрать флажки в списке Tabular options.
Диаграмма Box – and – Whisker Plot (ящик с «усами»), показанная в правой части рисунка 7, иллюстрирует распределение случайной величины по процентилям, которые приведены в форме Percentilies (левая часть рисунка). Ось абсцисс – это ось случайной величины. Крайняя левая вертикальная черта (правая граница ящика) с абсциссой 470 отвечает 100%. Середина «усов» - медиана, то есть отвечает 25%, правый конец «уса» с абсциссой 163 – 75% объема выборки.
График Scatterplot – это диаграмма рассеяния с осью абсцисс, оцифрованной в значениях случайной величины. На оси и выше точками показывается положение случайной величины.
График Frequency Histogram - обсуждавшаяся гистограмма, параметры которой можно установить в окне Frequency Plot Options Dialog Box, вызываемой командой Pane Option… в контекстном меню.
В окне Frequency Plot Options Dialog Box устанавливаются:
Можно установить флажки:
График Quintile Plot имеет вид накопительной кривой, глее по оси ординат откладываются квантили (доли объема выборки).
Диаграмма Normal Probability Plot (в правой части рис.8) имеет ось абсцисс, оцифрованную в значениях случайной величины; ось ординат, масштабируемую в значениях функции нормального распределения. Такому распределению отвечает график в виде прямой линии. Близость к ней фактической накопительной кривой, отмеченной маркерами, позволяет судить о согласии (или отсутствия такового) с нормальным законом. С помощью контекстного меню оси абсцисс и ординат можно поменять местами.
Рисунок
8 Рабочее окно STATGRAPHICS
с формой Summary Statistica
и диаграммой Bormal Probability
Plot
График Density Trace– эмпирическая кривая плотности распределения, параметры которого можно установить с помощью контекстного меню.
График
Symmetry Plot имеет ось абсцисс, оцифрованную
в значениях случайной величины; ось ординат,
масштабируемую в значениях функции симметричного
распределения. Такому распределению
отвечает график в виде прямой линии. Близость
к ней фактической накопительной кривой
позволяет судить о согласии с симметричным
распределением.
3.6. Анализ и интерпритация выборки данных.
Конечной целью компьютерной обработки выборки является оценка фактической выработки, доверителных интервалов и статистических оснований для пересмотра существующей нормы. С этой целью необходимо выяснить, насколько однородна выборка, и подобрать для нее подходящую модель распределения.
Гистограмма (рис.5) не противоречит представлениям об однородности выборки и в первом приближении позволяет оценить характер статистического распределения. Боле строго эти вопросы решаются при его моделировании, прежде всего тестировании на согласие с теоретическими статистическими моделями.
Тестирование эмпирического распределения на согласие с нормальным законом.
На несогласие анализируемого распределения с нормальным законом указывалось по результатам описательной статистики. Более строгое тестирование эмпирического распределения происходит при выполнении команд меню Describe Numeric Data Distribution Fitting. В появляющемся окне Distribution Fitting указывается столбец Col_1 с данными и нажимается кнопка ОК.
При этом выводится список Distribution Fitting Options для выбора подходящего теоретического распределения. Но иногда одно нажатие кнопки воспринимается как двойное, и сразу выводятся результаты тестирования нормального распределения, поскольку в диалоговом окне со списком распределений по умолчанию установлен флажок нормального закона.
Пиктограмма Tabular options на панели окна Distribution Fitting Col_1 служит для вызова списка опций. Опция Tests for Normality выводит одноименное окно с результатами тестирования.
Опция Goodness- of- Fit Tests используется для вызова одноименного окна с критерием согласия Колмогорова- Смирнова. По этому критерию вероятность ошибки отклонения нормального закона равна нулю.
Таким
образом, эмпирическая накопительная
кривая визуально и по ряду критериев
значимо не согласуется с теоретической
функцией распределения и напрашивается
выбор другой теоретической модели.
4. Процедуры обработки малых выборок в систем STATGRAPHICS.
Статистическая
обработка малой выборки в
системе STATGRAPHICS рассматривается на
примере обсуждавшихся суммарных дневных
выручек в торговой сети, состоящей из
ряда торговых точек. Анализируя выборки
за разные периоды с данными за 11 и 7 дней.
4.1. Вывод и интерпритация описательной статистики.
Для того чтобы проверить подчинение параметров анализируемых выборок нормальному закону, выводится таблица с описательной статистикой.
Для этого в меню Compare выбирается команда To Samples… и затем To - Sample Comparison… . В появляющемся диалоговом окне To - Sample Comparison в поле Sample 1 вводится ссылка на столбе с первой выборкой и в поле Sample 2 – на столбец со второй ссылкой. Для этого в списке столбцов выделяется нужное имя и нажимается кнопка ввода. После указания данных кнопкой ОК вызывается окно To - Sample Comparison ( рис.9) с панелью, на которой расположены пиктограммы, в том числе Tabular options и Graphical options для выбора таблицы, и графически с результатами анализа.
Пиктограмма Tabular options выводит одноименное диалоговое окно со списком опции. При выборе в нем опции Summary Statistical появляется таблица с необходимыми данными описательной статистики ( рис.9).
Пиктограмма Graphical options выводит одноименное диалоговое окно со списком графиков, из которых на рисунке 9 приведена диаграмма Frequency Histogram с гистограммами обеих выборок.
Рисунок
9 Рабочий лист STATGRAPHICS
с окном To- Sample Comparison.
По умолчанию в таблице Summary Statistical отображаются следующие данные: Count (Количество), Average (Среднее), Variance (Дисперсия), Standard devation (Среднеквадратичное отклонение), Minimum, Maximum, Stnd.skewness (Нормированный в своем среднеквадратичном отклонение коэффициент асиммтерии), Stnd.kurtusis (Нормированная в своем среднеквадратичном отклонении величина экцесса) и Sum (Сумма). Список выводимых статистик можно изменить посредством контекстного меню. В меню выбирается команда Pane Options… , которая выводит диалоговое окно со списком всех статистик. Их выбор осуществляется установкой флажков.
Отображаемые нормированные значения выборочных коэффицентов асимметрии и экцесса показывают, что коэффициенты отличаются от нулю в пределах стандартных ошибок и, следовательно, не противоречат гипотезе о подчинении выборок нормальному закону.
Ниже
экспертная система подтверждает этот
вывод, разъясняя, что в данном случае
при нормированных значениях
асимметрии и экцесса в пределах
от- 2 до 2 распределения выборок не
противоречит нормальному закону.
4.2. Сравнение средних в малых выборках.
Для
сравнения средних в
Рисунок
10 Рабочий лист STATGRAPHICS
с окном To- Sample Comparison ,
в котором выведены
результаты сравнения
средних двух выборок.
В таблице Сomparison of Means (рис.10) отображаются:
Для
графического сравнения средних
с помощью пиктограммы Graphica
На рис.11 по оси абсцисс (значений случайной величины) отображены прямоугольные области для каждой выборки с медианами (линии внутри) и стандартами изменений средних, причем для второй выборки показан также полуторных стандарт изменений вправо.
Рисунок
11 Рабочий лист STATGRAPHICS
с окном To- Sample Comparison
в котором выведена
диаграмма Box- and- Whisker
Plot.
5. Вывод статистик линейной связи в STATGRAPHICS.
STATGRAPHICS
- специализированная статистическая
графическая система обладает широкими
возможностями для численного и графического
анализа линейной связи.
5.1.Запуск пакета и ввод исходных данных.
При запуске выводится диалоговое окно StatWizard-Data Location с вопросом Were is your data? о данных пользователя и списком возможных вариантов ответов. По умолчанию установлен флажок Already Loadede in Statgraphics Plus Datasheet… (данные уже загружены в электронную таблицу). Для ввода собственных данных выбирается вариант I Want to enter New Data-отобразится предварительное пояснение следующего диалогового окна для определения столбца, его имени и типа переменной. После заполнения диалогового окна и нажатия кнопки Cancel появляется сообщение о возможности ввода данных и вызова мастера StatWizard с помощью одноименной пиктограммы на верхней панели.
Исходными являются данные, анализировавшиеся в других пиктограммных средствах, об аукционных ценах марочных вин и годах их закладки.
После ввода данных в каждом столбце необходимо проверить установку числового типа. Для этого столбец выделяется и вызывается контекстное меню, в котором выбирается команда Modify Column. В одноименном диалоговом окне можно ввести имя переменной (в поле Name), но, главное, следует убедиться в установке типа Numeric.
Первый столбец можно назвать YEAR, второй-COST$.
При
выполнении команд меню File
Save As
Save Data File As информация сохраняется
в виде файла данных с присваиваемых именем
и расширением .sf3.
Информация о работе Обработка статистических данных средствами пакета Statgraphics