Интервальная группировка

Автор работы: Пользователь скрыл имя, 13 Февраля 2011 в 14:00, реферат

Описание работы

Практически каждый исследовательский проект начинается с построения таблиц частот. Например, в социологических опросах ответы, измеренные в определенной шкале (в номинальной шкале, в порядковой шкале, в количественной шкале) можно свести в таблицу частот, например результаты голосования за кандидатов той или иной партии в зависимости от социального положения и среднедушевого дохода. В медицинских исследованиях табулируют пациентов с определенными симптомами. В маркетинговых исследованиях - покупательский спрос на товары разного типа у разных категорий населения.

Файлы: 1 файл

лабраб2.doc

— 542.00 Кб (Скачать файл)

      

      4. Выполнить расчеты в колонках  ti,  fit,  (fi'- fit)2/fit (2.13, 2.14, 2.15]. При расчете fit по формуле (2.13) предварительно в любой свободной ячейке (например в ячейке А2) рассчитаем промежуточную скалярную величину . Формула в ячейке А2 будет иметь вид:

      =Лист1!G22*Лист1!G17/Лист2!E21/КОРЕНЬ(2*ПИ())

      После этого в ячейки F5, G5, H5 вводим следующие формулы:

      в ячейке F5 - =[(D5-Лист1!$E$18)/Лист1!$E$21],

      в ячейке G5 - =ОКРУГЛ($A$2*EXP(-0.5*F5^2);0),

      в ячейке H5 - =[(E5-G5)^2/G5].

      Пояснение: на Лист1 расположены параметры интервального  ряда; на Лист2 – статистические характеристики интервального ряда. Теоретическая частота, рассчитываемая по формуле (2.15), является дробной величиной. Она округляется до ближайшего целого с помощью функции ОКРУГЛ().

      5. Значение суммы в колонке  есть искомое значение критерия Пирсона. Для вычисления суммы используется встроенная функция СУММ() или кнопка "Автосуммирования".

      6. Для определения критического  значения c2кр можно воспользоваться встроенной функцией ХИ2ОБР(a,m) при уровне значимости a=0,05 и числе степеней свободы m=k-2. Для данных примера расчетное значение c2p=19,964, критическое значение c2kr=12,592. Т.к. c2p>c2kr, то гипотеза о нормальном распределении отвергается. 

2.2.1.4. Построение графиков 

      1. Исходными данными для построения  графиков является  интервальный ряд (табл.3.5 рис.2.1).

      2. Выполнить команду /Вставка/Диаграмма/ либо нажать кнопку Мастера диаграмм. Это действие раскрывает диалоговое окно Мастер диаграмм. Мастер диаграмм представляет собой серию диалоговых окон для управления режимом построения диаграмм и установки параметров диаграмм. Построение диаграмм осуществляется по шагам - 4 шага. На каждом шаге раскрывается соответствующее диалоговое окно Мастера диаграмм. Диалоговые окна имеют несколько вкладок, которые открываются кнопками, расположенными в верхней части диалоговых окон. В нижней части окон Мастера диаграмм изображены кнопки Отмена, <Назад, Далее>, Готово. Кнопка Отмена прекращает построение диаграмм и закрывает окно Мастера диаграмм. Кнопка Далее> осуществляет переход к следующему шагу построения диаграмм. Кнопка <Назад позволяет вернуться к предыдущему шагу при необходимости исправить установки на предыдущих шагах. Окна имеют одно или несколько строк ввода для установки значений параметров диаграмм.

      3. Окно шаг 1 из 4 Мастера диаграмм предлагает выбрать тип диаграммы. Excel имеет возможность выбора 14 различных типов стандартных диаграмм. Каждый тип в свою очередь имеет насколько форматов. Окно имеет две вкладки - стандартные и нестандартные. Открываем вкладку стандартные и выбираем следующие типы диаграмм: для гистограммы - "гистограмма", для полигона частот и кумулятивной кривой - "график".

      4. Окно Шаг 2 из 4 Мастера диаграмм предлагает выбрать данные для построения диаграммы, положение данных в таблице (по строкам или столбцам), данные для разметки оси Х. Для выбора данных раскрываем вкладку Диапазон данных, активизируем строку ввода диапазон, открываем лист, содержащий интервальный ряд. Далее выделяем соответствующий блок ячеек: построение гистограммы и полигона частот осуществляется по данным колонки fi табл.3.5 рис.2.3, кумулятивная кривая строится по данным колонки si. Вкладка Ряды позволяет выбрать данные для разметки оси Х. Активизируем в ней строку ввода Подписи оси Х и в табл.3.5 выделяем данные для разметки оси Х: для гистограммы и кумулятивной кривой это будут данные столбца xi, для полигона - данные столбца xSRi.

      5. Окно Шаг 3 из 4 Мастера диаграмм предлагает установить следующие параметры диаграмм: название диаграммы, названия оси Х и оси У, надписи на осях, установить координатную сетку или ее отменить, изменить размещение легенд. Открываем вкладку Заголовки и поочередно активизируя соответствующие строки ввода, вводим название диаграммы и название осей. Вкладка Оси позволяет установить или убрать разметку осей. Вкладка Подписи данных позволяет установить или убрать подписи значений данных на диаграмме. Вкладка Линии сетки позволяет изменить координатную сетку или убрать ее совсем. Вкладка Таблица данных позволяет поместить таблицу значений признака под диаграммой.

      6. Окно Шаг 4 из 4 Мастера диаграмм предлагает поместить диаграмму на отдельном листе или на существующем. Выбираем на существующем. После этого нажать кнопку Готово.

      7. При неудовлетворительном выборе  параметров диаграмм и графиков  можно выполнить редактирование соответствующих элементов (см.п.1.9).

       8. Гистограмма,  полигон частот и кумулятивная  кривая изображены на рис.2.8.

 

    3.2. Технология выполнения интервальной группировки в Statistica

 

   Для выполнения группировки в системе  Statistica из стартовой панели модуля Описательные статистики и таблицы выбирается процедура Таблицы частот По этой команде открывается одноименный диалог рис.3.1. Это окно содержит пять вкладок: Быстрый, Дополнительно, Опции, Описательные, Нормальность и кнопки управления: Переменные, Ок, Отмена, Опции.

    Этот диалог предлагает множество настроек, позволяющие изменять вид и группировку в таблицах частот, проверять нормальность распределения, в том числе и графическим способом. Диалог в режиме вкладки Быстрый содержит несколько управляющих кнопок.

   Кнопка  Переменные открывает стандартное окно выбора списка переменных для анализа.

   После нажатия этой кнопки ОК программа вычислит описательные статистики для всех выбранных переменных и разместит их в таблице.

   Отмена. При нажатии кнопки Отмена закрывается текущий диалог и появляется стартовая панель модуля Основные статистики и таблицы.

   Опции. При нажатии этой кнопки вызывается меню Опции в котором устанавливаются режим вычисления с повышенной точностью и некоторые параметры отображения таблиц и графиков.

   Ниже  кнопки Опции находятся две кнопки: Кнопка SELEKT CASES (Выбор наблюдений). При нажатии этой кнопки появляется диалоговое окно Условия выбора наблюдений Анализа/Графика. Эта функция используется для того, чтобы включить в анализ только подмножество наблюдений.

     При нажатии кнопки В (Вес)  появляется диалоговое окно Веса наблюдений Анализа/Графика. Эта функция позволяет "изменять" вклад отдельных наблюдений, пропорциональных значениям выбранной переменной.

   Правила установки Условий выбора наблюдений и установка весов наблюдений описаны в гл.1.

   В правом нижнем углу диалогового окна находится группа опций Удаление ПД. Если выбрано Построчное удаление пропусков, то STATISTICA игнорирует все наблюдения, имеющие пропуски хотя бы для одной переменной в списке. Если выбрано Попарное удаление пропусков, то наблюдения будут удаляться из вычислений вместе с переменными, для которых в них содержатся пропущенные данные.

   Вкладка Быстрый

   Вкладка Быстрый содержит доступ к опциям, представленным на рис.3.1.

   Кнопка  Таблицы частот строит последовательность таблиц частот для выбранных переменных по одной для каждой переменной. Способ, которым переменные группируются в таблицах частот определяется опцией из набора опций Mетод категоризации для таблиц и графиков (см. вкладку Дополнительно). Опции из раздела Опции отображения (см. вкладку Опции) определяют различные обобщающие статистики, которые будут включены в таблицу частот. Если выбран какой-либо Критерий нормальности (например, если выбрана любая опция из раздела, см. вкладку Нормальность), тогда для каждой переменной появится дополнительная таблица с результатами вычисления соответствующего критерия.

   Кнопка  Гистограммы строит последовательность гистограмм по одной для каждой выбранной переменной. Способ группировки переменных при построении гистограмм определяется теми же настройками, что и при построении Таблиц частот.

   Кнопка  Описательные статистики строит таблицы с описательными статистиками для каждой переменной. Способ обработки данных при вычислении описательных статистик зависит от установки опции в наборе Mетод категоризации для таблиц и графиков (см. вкладку Дополнительно):

   В частности:

   1. Если выбрана опция Размер шага и пользователем задано минимальное значение, тогда все наблюдения, которые не превышают это заданное значение, будут проигнорированы;

   2. Если выбрана опция Целые категории, то все нецелые значения будут проигнорированы;

   3. Если выбрана опция Заданные группирующие коды (значения), то все значения, которые не совпадают ни с одним из выбранных целых кодов, будут проигнорированы;

   4. Если выбрана опция Определенные пользователем категории, то кнопки Описательные статистики будут неактивными (потому что сложные правила разбиения на группы могут привести к тому, что одно наблюдение может быть приписано более чем к одной категории). Наблюдение будет приписано первому Определенному пользователем интервалу, которому оно "удовлетворяет" и Описательные статистики для этих интервалов вычисляться не будут.

   Во  всех случаях пропущенные данные будут построчно или попарно, удаляться в зависимости от выбора в разделе Удаление ПД.

   3М  гистограммы. Эта опция строит последовательность 3М гистограмм для выбранных переменных, по одному на каждую выбранную переменную. После нажатия этой кнопки программа попросит пользователя выбрать два набора переменных (из выбранных ранее с помощью кнопки Переменные). 3М гистограммы будут построены для каждой пары переменных, включающей переменные из разных списков.

   Вкладка Дополнительно

    Вкладка Дополнительно содержит доступ опциям, представленным на рис.2.3. Данные опции служат для управления способом группировки в таблицах частот, в графиках и при расчете описательных статистик.

   Кнопки  Таблицы частот и Гистограммы имеют такое же назначение, что и во вкладке Быстрый.

   Опции в наборе Mетод категоризации для таблиц и графиков определяют, как будут сгруппированы или табулированы выбранные переменные в таблицах частот и в гистограммах, а также как обрабатываются наблюдения при расчете описательных статистик.

   Все различные значения – частоты строятся с учетом всех различных значений анализируемых переменных.

   С текстовыми значениями – частоты строятся с учетом всех текстовых значений выбранных переменных.

   Число равных интервалов – диапазон значений каждой переменной делится на указанное число интервалов:

   Приблизительное число интервалов: – построит приближенные интервалы и выберет приближенный шаг так, что последняя десятичная цифра в значениях границ интервалов будет равна 1, 2 или 5 (например, 10.5, 11.0, 11.5, и т.д.). Такие интервалы легче интерпретировать, чем интервалы с большим числом десятичных разрядов.

   Размер  шага – Опция задает ширину интервала категоризации в таблицах частот (и гистограммах). Если выбрана опция с мин. значения, то группировка начинается с минимального значения переменной (первый интервал группировки включает это значение). Если опция не выбрана, то левая граница первого интервала группировки задается пользователем в соответствующем поле.

Информация о работе Интервальная группировка