Интервальная группировка
Реферат, 13 Февраля 2011, автор: пользователь скрыл имя
Описание работы
Практически каждый исследовательский проект начинается с построения таблиц частот. Например, в социологических опросах ответы, измеренные в определенной шкале (в номинальной шкале, в порядковой шкале, в количественной шкале) можно свести в таблицу частот, например результаты голосования за кандидатов той или иной партии в зависимости от социального положения и среднедушевого дохода. В медицинских исследованиях табулируют пациентов с определенными симптомами. В маркетинговых исследованиях - покупательский спрос на товары разного типа у разных категорий населения.
Файлы: 1 файл
лабраб2.doc
— 542.00 Кб (Скачать файл)d- среднеквадратическое отклонение.
Правило
проверки заключается в следующем.
Определяем по таблице распределения c
- квадрат критическое значение
для числа
степеней свободы m=k-2 и заданного
уровня значимости a=0.05. Затем сравниваем
расчетное и критическое значения критерия
Пирсона. Если
, то выдвинутая
гипотеза о нормальном распределении
интервального ряда не отвергается (не
противоречит опытным данным) с вероятностью
ошибки a=0.05.
2.1.4.
Графическое изображение
интервального ряда
Для визуального наблюдения характера распределения частот, определения положения среднего значения , моды MO, медианы ME и характера рассеивания значений дисперсии d2 и среднеквадратичного отклонения d интервальные ряды изображают графически. Для этого строятся следующие диаграммы - гистограмма, полигон частот и кумулятивная кривая.
При
построении гистограммы по оси абсцисс
прямоугольной системы
При
построении полигона частот по оси
абсцисс прямоугольной системы
координат откладываются
При построении кумулятивной кривой по оси абсцисс откладываются величины интервалов, по оси ординат накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Эти перпендикуляры соединяют и получают ломанную линию - кумулятивную кривую.
2.2.ТЕХНОЛОГИЯ ВЫПОЛНЕНИЯ РАБОТЫ
Алгоритм
выполнения лабораторной работы покажем
на примере данных, представленных
на рис 6.1.
2.2.1.С
использованием табличного
процессора Excel.
2.2.1.1.
Построение интервального ряда.
- Открываем новый рабочий лист электронной таблицы. В блок ячеек A5:J14 заполняем значения исходного ряда (см. рис.6.1). Расположение блоков с промежуточными данными и результатами вычислений представлено на рис.2.1.
2.
Определяется количество групп
К. Значение К округляется до
большего нечетного целого. Для
определения большего целого
от вещественного числа
ОКРВВЕРХ(1+3,3222*LOG10(
Примечание: Здесь далее если в тексте приведены расчетные формулы и функции в интерпретации Excel, то адреса ячеек и блоков ячеек в этих формулах соответствуют рассматриваемому примеру, т.е. такому расположению данных, как на представленных рисунках. При другом расположении эти адреса будут другими.
3.
Определение минимального и
4.
Определение размаха
5. Вычисляется длина интервала h, в ячейку G22 вводится формула =G21/G18;
6.
Вычисляются начальное и
Значения представить в расчетном блоке в виде таблицы (табл.3.4 рис.2.1)
7.
Далее приступаем к построению
интервального ряда, который на
рис.2.1 представлен в виде
8.
Определение частот. Выделить массив
ячеек (колонку "частота"). Размер
выделенного блока должен быть
равен размеру заполненной
В строку ввода Массив данных ввести координаты блока ячеек (в рассматриваемом примере блок [A5:J14]), содержащего исходный массив данных). В строку ввода Двоичный массив ввести координаты блока ячеек со значениями интервалов (в примере блок [B30:B39]). Нажать кнопку ОК. После этого нажать клавишу [F2] (редактирование) и затем нажать комбинацию клавиш Ctrl + Shift + Enter. Частота в i-ой строке fi соответствует интервалу [xi-1;xi].
9.
Для расчета относительной
Замечания по вводу формул:
- формула для частости wi=fi/n должна иметь абсолютную ссылку на ячейку, содержащую значения n. При расположении блоков данных так как на рис.2.1 в ячейку D31 вводится следующая формула =C31/$G$17;
- для
определения накопленной
частоты используется встроенная функция СУММ(). Установить курсор в ячейку E31 и вызвать функция СУММ() с помощью команды меню /Вставка или кнопки Мастера функций. Аргументом функции является блок ячеек, состоящий из одной ячейки, в качестве которой будет вторая ячейка колонки "частота". Первая координата блока должна быть абсолютной (фиксированной), вторая - относительной. Поэтому при копировании формулы в последующие ячейки происходит вычисление суммы с накоплением. В рассматриваемом примере формула во второй ячейке колонки "накопленная частота" E31 имеет вид СУММ($C$31:C31). - при вычислении середины интервала xSRi=(xi-1+xi)/2 во вторую ячейку этой колонки (ячейку F31) вводится формула =(B30+B31)/2.
- формулы для абсолютной плотности mai=fi/h и для относительной плотности moi=wi/h должны иметь абсолютную ссылку на ячейку, содержащую значение интервала h. Соответственно в ячейки G31 и H31 вводятся следующие формулы =C31/$G$22 и =D31/$G$22.
10. В Excel группировку можно выполнить с помощью команды /Cервис/анализ данных/гистограмма. При этом раскрывается диалоговое окно рис.2.4. В строке ввода Входной диапазон указываются координаты блока исходного ряда [A5:J14]; в строке Интервал карманов - координаты блока значений интервалов [B30:B39]; в строке Выходной диапазон – координаты блока результатов J28, которые также показаны на рис. 2.4. Установить флажок в строке Вывод графика для вывода гистограммы.
Результаты выполнения команды /Cервис/анализ данных/гистограмма приведены на рис. 2.5.
2.2.1.2.
Статистические характеристики
интервального ряда
1. Исходными данными для расчета статистических характеристик интервального ряда является интервальный ряд, полученный в предыдущей пункте.
2.
Для удобства вычислений
- Выполнить расчет в колонке xSri*fi . Для этого в первую ячейку колонки E5 ввести формулу [=B5*C5], затем выполнить копирование ее в остальные ячейки колонки.
4. Используя функцию СУММ() или нажать кнопку Автосуммирование, определить итоговые суммы в колонках fi и xSRi×fi (ячейки C14, E14).
5. Рассчитать среднее значение . Для этого в ячейку E18 ввести формулу [=E14/C14].
6.
В следующих колонках
7. Вычислить итоговые суммы в колонках "(xsri -`x )2×fi", "(xsri -`x)3×fi", "(xsri -`x)4×fi". Для этого используется встроенная функция СУММ() или нажать кнопку Автосуммирования.
8.
Рассчитать значения дисперсии
9.
Рассчитываются значения
2.2.1.3. Проверка гипотезы о нормальном распределении
интервального
ряда
1.
Исходными данными для
2.
Для удобства вычислений
Значения колонок xSRi и fi копируются из табл.3.5 (команды: /Правка/копировать и /Правка/специальная вставка/значения).
3.
При малых значениях частот (менее
3) рекомендуется объединять