Обработка статистических данных средствами пакета Statgraphics

Автор работы: Пользователь скрыл имя, 05 Декабря 2011 в 17:00, курсовая работа

Описание работы

Основная цель данной курсовой работы – решение некоторых экономических задач с помощью статистического пакета StatGraphics.
Для достижения поставленной цели необходимо решить следующие задачи:
1. Изучить и систематизировать литературу по статистическим методам обработки информации.
2. Изучить пакет StatGraphics.

Файлы: 1 файл

Курсовая по информатике Statgraphics .doc

— 1.23 Мб (Скачать файл)

   В первом столбце стоят числа –  накопительные количества, насчитываемые  сверху от первого интервала до медианного и от последнего интервала снизу до медианы. Кумуляты нарастают к медианному интервалу, характеризуя ствол дерева выборки.

   Форма Confidence Intervals (Доверительные интервалы) выводит интервалы возможных значений математического ожидания и среднеквадратичного отклонения с доверительной вероятностью не менее 95%. Ее величина изменяется посредством вызова контекстного меню и выбора в нем команды Pane Option…, выводящее окно для ввода доверительной вероятности.

   Форма Hypothesis Tests (проверка гипотез) отображает результаты проверки  тремя методами гипотез о значимости отклонений среднего  и медианы от нуля (по умолчанию) или другого значения, задаваемого посредством контекстного меню и выбора в нем команды Pane Option…, выводящее диалоговое окно для ввода доверительной вероятности и сопоставляемого значения. Нулевая (проверяемая гипотеза) может заключаться в том, что среднее и медиана не равны введенному значению, больше или меньше его.

   В форме Percentilies (Процентили), показанной в левой части рисунка 7, - значения случайной величины для указанных процентов объема выборки: 60 для 5%, 71 для 10% т. д. Проценты для выводимых значений случайной величины можно изменить в окне, которое появляется при вызове контекстного меню. 

   

Рисунок 7 Рабочее окно STATGRAPHICS с диаграммой BOX- and- WHISKER Plot 

   3.5. Опции графического представления данных.

  Встроенные  графики в STATGRAPHICS выбираются из списка, который вызывается в окне Variable Analysis- Col_1 щелчком по пиктограмме Graphical Options. Для выбора графика достаточно установить флажок на названии и нажать кнопку OK . График выводится в правую часть окна Variable Analysis- Col_1, но может быть расширен на все окно, если убрать флажки в списке Tabular options.

  Диаграмма Box – and – Whisker Plot (ящик с «усами»), показанная в правой части рисунка 7, иллюстрирует распределение случайной величины  по процентилям, которые приведены в форме Percentilies (левая часть рисунка). Ось абсцисс – это ось случайной величины. Крайняя левая вертикальная черта (правая граница ящика)  с абсциссой 470 отвечает 100%. Середина «усов» - медиана, то есть отвечает 25%, правый конец «уса» с абсциссой 163 – 75% объема выборки.

  График  Scatterplot – это диаграмма рассеяния с осью абсцисс, оцифрованной в значениях случайной величины. На оси и выше точками показывается положение случайной величины.

  График  Frequency Histogram  - обсуждавшаяся гистограмма, параметры которой можно установить в окне Frequency Plot Options Dialog Box, вызываемой командой Pane Option… в контекстном меню.

  В окне Frequency Plot Options Dialog Box устанавливаются:

  • Number of Classes – число интервалов группирования (по умолчанию их 9);
  • Lowel Limit – начало первого интервала группирования (по умолчанию их 0);
  • Upper Limit – конец последнего интервала группирования (по умолчанию их 500).

   Можно  установить флажки:

    • Hold – сохранение установок для последующих построений;
    • Relative Counts – вывод частот в относительном выражении (%);
    • Comulative Counts – вывод накопительной кривой;
    • Histogram – вывод гистограммы;
    • Polygon – вывод полигонального графика частот.

  График  Quintile Plot имеет вид накопительной кривой, глее по оси ординат откладываются квантили (доли объема выборки).

  Диаграмма Normal Probability Plot (в правой части рис.8) имеет ось абсцисс, оцифрованную в значениях случайной величины; ось ординат, масштабируемую в значениях функции нормального распределения. Такому распределению  отвечает график в виде прямой линии. Близость к ней фактической накопительной кривой, отмеченной маркерами, позволяет судить о согласии (или отсутствия такового) с нормальным законом. С помощью контекстного меню  оси абсцисс и ординат можно поменять местами.

  

Рисунок 8 Рабочее окно STATGRAPHICS с формой Summary Statistica и диаграммой Bormal Probability Plot 

  График  Density Trace– эмпирическая кривая  плотности     распределения, параметры которого можно  установить с помощью контекстного меню.

  График  Symmetry Plot имеет ось абсцисс, оцифрованную в значениях случайной величины; ось ординат, масштабируемую в значениях функции симметричного распределения. Такому распределению отвечает график в виде прямой линии. Близость к ней фактической накопительной кривой позволяет судить о согласии с симметричным  распределением. 

  3.6. Анализ и интерпритация выборки данных.

  Конечной  целью компьютерной обработки выборки  является оценка фактической выработки, доверителных интервалов и статистических оснований для пересмотра существующей нормы. С этой целью необходимо выяснить, насколько однородна выборка, и подобрать для  нее подходящую модель распределения.

  Гистограмма (рис.5) не противоречит представлениям об однородности  выборки и в  первом приближении позволяет оценить  характер статистического распределения. Боле строго эти вопросы решаются при его моделировании, прежде всего тестировании на согласие с теоретическими статистическими моделями.

  Тестирование  эмпирического распределения  на согласие с нормальным законом.

  На  несогласие анализируемого распределения  с нормальным законом указывалось  по результатам описательной статистики. Более строгое тестирование эмпирического распределения происходит при выполнении  команд меню Describe Numeric Data Distribution Fitting. В появляющемся окне Distribution Fitting указывается столбец Col_1 с данными и нажимается кнопка ОК.

  При этом выводится список Distribution Fitting Options для выбора подходящего теоретического распределения. Но иногда одно нажатие кнопки воспринимается как двойное, и сразу выводятся результаты тестирования нормального распределения, поскольку в диалоговом окне со списком распределений по умолчанию установлен флажок нормального закона.

  Пиктограмма Tabular options на панели окна Distribution Fitting Col_1 служит для вызова списка опций. Опция Tests for Normality выводит одноименное окно с результатами тестирования.

  Опция Goodness- of- Fit Tests используется для вызова одноименного окна с критерием согласия Колмогорова- Смирнова. По этому критерию вероятность ошибки отклонения нормального закона равна нулю.

  Таким образом, эмпирическая накопительная  кривая визуально и по ряду критериев  значимо не согласуется  с теоретической  функцией распределения и  напрашивается  выбор другой теоретической модели. 
 
 

  4. Процедуры обработки  малых выборок  в систем STATGRAPHICS.

  Статистическая  обработка малой выборки в  системе STATGRAPHICS рассматривается на примере обсуждавшихся суммарных дневных выручек в торговой сети, состоящей из ряда торговых точек. Анализируя выборки за разные периоды с данными за 11 и 7 дней. 

  4.1. Вывод и интерпритация  описательной статистики.

  Для того чтобы проверить подчинение параметров анализируемых выборок  нормальному закону, выводится таблица  с описательной статистикой.

  Для этого в меню Compare выбирается команда To Samples… и затем To - Sample Comparison… . В появляющемся диалоговом окне To - Sample Comparison в поле Sample 1 вводится ссылка на столбе с первой выборкой и в поле Sample 2 – на столбец со второй ссылкой. Для этого в списке столбцов выделяется нужное имя и нажимается кнопка ввода. После указания данных кнопкой ОК вызывается окно To - Sample Comparison ( рис.9) с панелью, на которой расположены пиктограммы, в том числе Tabular options и Graphical options для выбора таблицы, и графически с результатами анализа.

  Пиктограмма Tabular options выводит одноименное диалоговое окно со списком опции. При выборе в нем опции Summary Statistical появляется таблица с необходимыми данными описательной статистики ( рис.9).

  Пиктограмма Graphical options выводит одноименное диалоговое окно со списком графиков, из которых на рисунке 9 приведена диаграмма Frequency Histogram с гистограммами обеих выборок.

  

Рисунок 9 Рабочий лист STATGRAPHICS с окном To- Sample Comparison. 

  По умолчанию в таблице Summary Statistical отображаются следующие данные: Count (Количество), Average (Среднее), Variance (Дисперсия), Standard devation (Среднеквадратичное отклонение),  Minimum, Maximum, Stnd.skewness (Нормированный в своем среднеквадратичном отклонение  коэффициент асиммтерии), Stnd.kurtusis (Нормированная в своем среднеквадратичном отклонении величина экцесса) и   Sum (Сумма). Список выводимых статистик можно изменить посредством контекстного меню. В меню выбирается команда Pane Options… , которая выводит диалоговое окно со списком всех статистик. Их выбор осуществляется установкой флажков.

  Отображаемые  нормированные значения выборочных коэффицентов асимметрии и экцесса  показывают, что коэффициенты отличаются от нулю в пределах стандартных ошибок и, следовательно, не противоречат гипотезе о подчинении выборок нормальному закону.

  Ниже  экспертная система подтверждает этот  вывод, разъясняя, что в данном случае при нормированных значениях  асимметрии и экцесса в пределах от- 2 до 2 распределения выборок не противоречит нормальному закону. 

  4.2. Сравнение средних  в малых выборках.

  Для сравнения средних в обсуждаемых  выборках пиктограммой Tabular options вызывается одноименное диалоговое окно со списком опций и в нем выбирается команда Сomparison of Means (рис.10).

  

Рисунок 10 Рабочий лист STATGRAPHICS с окном To- Sample Comparison , в котором выведены результаты сравнения средних двух выборок. 

  В таблице Сomparison of Means (рис.10) отображаются:

  • средние значения выборок и возможные интервалы их изменения с доверительной вероятностью 95%;
  • t- значения и вероятности разницы средних в нулевой гипотезе ( о равенстве средних) и альтернативных гипотезах (средние не равны, первое больше второго и первое меньше второго) при одинаковых и разных дисперсиях;
  • разъяснения результатов t- тестирования обеих выборокю

   Для графического сравнения средних  с помощью пиктограммы Graphical options вызывается одноименное окно со списком встроенных диаграмм, среди которых выбирается Box- and- Whisker Plot, показанная на рис.11.

   На  рис.11 по оси абсцисс (значений случайной величины) отображены прямоугольные области для каждой выборки с медианами (линии внутри) и стандартами изменений средних, причем для второй выборки показан также полуторных стандарт изменений вправо.

   

Рисунок 11 Рабочий лист STATGRAPHICS с окном To- Sample Comparison в котором выведена диаграмма Box- and- Whisker Plot. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

   5. Вывод статистик  линейной связи  в STATGRAPHICS.

   STATGRAPHICS - специализированная статистическая графическая система обладает широкими возможностями для численного и графического анализа линейной связи. 

   5.1.Запуск  пакета и ввод  исходных данных.

   При запуске выводится диалоговое окно StatWizard-Data Location с вопросом Were is your data? о данных пользователя и списком возможных вариантов ответов. По умолчанию установлен флажок Already Loadede in Statgraphics Plus Datasheet… (данные уже загружены в электронную таблицу). Для ввода собственных данных выбирается вариант I Want to enter New Data-отобразится предварительное пояснение следующего диалогового окна для определения столбца, его имени и типа переменной. После заполнения диалогового окна и нажатия кнопки Cancel появляется сообщение о возможности ввода данных и вызова мастера StatWizard с помощью одноименной пиктограммы на верхней панели.

   Исходными являются данные, анализировавшиеся  в других пиктограммных средствах, об аукционных ценах марочных вин  и годах их закладки.

   После ввода данных в каждом столбце  необходимо проверить установку  числового типа. Для этого столбец выделяется и вызывается контекстное меню, в котором выбирается команда Modify Column. В одноименном диалоговом окне можно ввести имя переменной (в поле Name), но, главное, следует убедиться в установке типа Numeric.

   Первый  столбец можно назвать YEAR, второй-COST$.

   При выполнении команд меню File Save As Save Data File As   информация сохраняется в виде файла данных с присваиваемых именем и расширением .sf3. 

Информация о работе Обработка статистических данных средствами пакета Statgraphics