Интервальная группировка

Автор работы: Пользователь скрыл имя, 13 Февраля 2011 в 14:00, реферат

Описание работы

Практически каждый исследовательский проект начинается с построения таблиц частот. Например, в социологических опросах ответы, измеренные в определенной шкале (в номинальной шкале, в порядковой шкале, в количественной шкале) можно свести в таблицу частот, например результаты голосования за кандидатов той или иной партии в зависимости от социального положения и среднедушевого дохода. В медицинских исследованиях табулируют пациентов с определенными симптомами. В маркетинговых исследованиях - покупательский спрос на товары разного типа у разных категорий населения.

Файлы: 1 файл

лабраб2.doc

— 542.00 Кб (Скачать файл)

     d- среднеквадратическое отклонение.

     Правило проверки заключается в следующем. Определяем по таблице распределения c - квадрат критическое значение для числа степеней свободы m=k-2 и заданного уровня значимости a=0.05. Затем сравниваем расчетное и критическое значения критерия Пирсона. Если , то выдвинутая гипотеза о нормальном распределении интервального ряда не отвергается (не противоречит опытным данным) с вероятностью ошибки a=0.05. 

2.1.4. Графическое изображение  интервального ряда 

     Для визуального наблюдения характера  распределения частот, определения  положения среднего значения , моды MO, медианы ME и характера рассеивания значений дисперсии d2 и среднеквадратичного отклонения d интервальные ряды изображают графически. Для этого строятся следующие диаграммы - гистограмма, полигон частот и кумулятивная кривая.

     При построении гистограммы по оси абсцисс  прямоугольной системы координат  откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов пропорциональна частотам. В случае неравных интервалов высота столбиков пропорциональна относительным частотам (частостям).

     При построении полигона частот по оси  абсцисс прямоугольной системы  координат откладываются средние  значения интервалов, по оси ординат  наносится шкала для выражения  величины частот. Полученные на пересечении  абсцисс и ординат точки соединяют прямыми линиями, в результате получают ломанную, называемую полигоном частот.

     При построении кумулятивной кривой по оси  абсцисс откладываются величины интервалов, по оси ординат накопленные  частоты, которые наносят на поле графика в виде перпендикуляров  к оси абсцисс в верхних границах интервалов. Эти перпендикуляры соединяют и получают ломанную линию - кумулятивную кривую.

2.2.ТЕХНОЛОГИЯ  ВЫПОЛНЕНИЯ РАБОТЫ

 

     Алгоритм  выполнения лабораторной работы покажем  на примере данных, представленных на рис 6.1. 

     2.2.1.С использованием табличного процессора Excel. 

    2.2.1.1. Построение интервального ряда. 

  1. Открываем новый рабочий лист электронной  таблицы. В блок ячеек A5:J14 заполняем значения исходного ряда (см. рис.6.1). Расположение блоков с промежуточными данными и результатами вычислений представлено на рис.2.1.

     2. Определяется количество групп  К. Значение К округляется до  большего нечетного целого. Для  определения большего целого  от вещественного числа используется  встроенная функция ОКРВВЕРХ(). Для  вычисления логарифма от объема выборки используется функция LOG10(). Для вычисления К в ячейку G18 (см. рис.2.3) записывается следующая формула:

     ОКРВВЕРХ(1+3,3222*LOG10(G17);1).

     

     Примечание: Здесь далее если в тексте приведены расчетные формулы и функции в интерпретации Excel, то адреса ячеек и блоков ячеек в этих формулах соответствуют рассматриваемому примеру, т.е. такому расположению данных, как на представленных рисунках. При другом расположении эти адреса будут другими.

     3. Определение минимального и максимального  значений xmin, xmax осуществляется с использованием встроенных функций МАКС(A5:J14) и МИН(A5:J14), записываемые в ячейки G19 и G20;

     4. Определение размаха варьирования  признака R, в ячейку G21 вводится формула =G19-G20;

     5. Вычисляется длина интервала  h, в ячейку G22 вводится формула =G21/G18;

     6. Вычисляются начальное и конечное  значения соответственно первого  и последнего интервалов xo, xk. В ячейку G23 вводится формула =G20-G22/2. В ячейку G24 вводится формула =G19+G22/2.

     Значения  представить в расчетном блоке в виде таблицы (табл.3.4 рис.2.1)

     7. Далее приступаем к построению  интервального ряда, который на  рис.2.1 представлен в виде результирующей  таблицы (табл.3.5). Колонка "интервал" результирующей таблицы содержит  верхние граничные значения интервалов. Определение их выполняется следующим образом. В первую ячейку колонки "интервал" (в ячейку B31) ввести значение x0, выделить блок для заполнения значений интервалов, т.е. колонку, содержащую к+2 ячеек (блок  B30:B39), выполнить команду /Правка/заполнить/прогрессия/арифметическая. По этой команде раскрывается диалог рис.2.2, в котором устанавливаются следующие опции: Расположение - по столбцам, Тип - арифметическая. В строке ввода Шаг ввести значение h, в строке ввода Предельное значение ввести значение xk , затем нажать кнопку ОК.

     

     8. Определение частот. Выделить массив  ячеек (колонку "частота"). Размер  выделенного блока должен быть  равен размеру заполненной колонки  "интервал". Выполнить команду  /Встроить/функцию или нажать кнопку Мастер функции fx . Открывается диалоговое окно Мастер функций в положении “шаг 1 из 2”, в котором выбрать функцию /Статистические/частота. После этого раскрывается диалоговое окно для установки параметров рис. 2.3.

     

     В строку ввода Массив данных ввести координаты блока ячеек (в рассматриваемом примере блок [A5:J14]), содержащего исходный массив данных). В строку ввода Двоичный массив ввести координаты блока ячеек со значениями интервалов (в примере блок [B30:B39]). Нажать кнопку ОК. После этого нажать клавишу [F2] (редактирование) и затем нажать комбинацию клавиш Ctrl + Shift + Enter. Частота в i-ой строке fi соответствует интервалу [xi-1;xi].

     9. Для расчета относительной частоты   wi, накопленной частоты Si, середины интервалов xSRi, абсолютной плотности mai, относительной плотности moi во вторые ячейки каждой колонки вводится соответствующая формула (первая строка таблицы частот имеет нулевую частоту, т.е. является не информативной). Затем производится копирование формул на всю колонку командой /Правка/копировать.

     Замечания по вводу формул:

  • формула для частости wi=fi/n должна иметь абсолютную ссылку на ячейку, содержащую значения n. При расположении блоков данных так как на рис.2.1 в ячейку D31 вводится следующая формула =C31/$G$17;

  •  для  определения накопленной частоты  используется встроенная функция  СУММ(). Установить курсор в ячейку  E31 и вызвать функция СУММ() с помощью команды меню /Вставка или кнопки Мастера функций. Аргументом функции является блок ячеек, состоящий из одной ячейки, в качестве которой будет вторая ячейка колонки "частота". Первая координата блока должна быть абсолютной (фиксированной), вторая - относительной. Поэтому при копировании формулы в последующие ячейки происходит вычисление суммы с накоплением. В рассматриваемом примере формула во второй ячейке колонки "накопленная частота" E31 имеет вид СУММ($C$31:C31).
  • при вычислении середины интервала xSRi=(xi-1+xi)/2 во вторую ячейку этой колонки (ячейку F31) вводится формула =(B30+B31)/2.
  • формулы для абсолютной плотности mai=fi/h и для относительной плотности moi=wi/h должны иметь абсолютную ссылку на ячейку, содержащую значение интервала h. Соответственно в ячейки G31 и H31 вводятся следующие формулы =C31/$G$22  и =D31/$G$22.

     10. В Excel группировку можно выполнить с помощью команды /Cервис/анализ данных/гистограмма. При этом раскрывается диалоговое окно рис.2.4. В строке ввода Входной диапазон указываются координаты блока исходного ряда [A5:J14]; в строке Интервал карманов - координаты блока значений интервалов [B30:B39]; в строке Выходной диапазон – координаты блока результатов J28, которые также показаны на рис. 2.4. Установить флажок в строке Вывод графика для вывода гистограммы.

     Результаты  выполнения команды /Cервис/анализ данных/гистограмма приведены на рис. 2.5.

       

     2.2.1.2. Статистические характеристики  интервального ряда 

      1. Исходными данными для расчета  статистических характеристик интервального ряда является интервальный ряд, полученный в предыдущей пункте.

      2. Для удобства вычислений составим  вспомогательную таблицу, содержащую  промежуточные данные. Ее можно  расположить на новом рабочем  листе (см. табл.3.6 рис.2.6). Данные колонок xSRi, fi, si копируются в новый рабочий лист из предыдущего листа (табл.3.5 рис. 2.1). Для этого необходимо выполнить следующие действия: выделить копируемый блок ячеек из табл.3.5 рис.2.1, выполнить команду /Правка/копировать, перейти на новый лист, указать блок-получатель (левую верхнюю ячейку), выполнить команду /Правка/специальная вставка/значения.

    1. Выполнить расчет в колонке xSri*fi . Для этого в первую ячейку колонки E5 ввести формулу [=B5*C5], затем выполнить копирование ее в остальные ячейки колонки.
 

      4. Используя функцию СУММ() или нажать  кнопку Автосуммирование, определить итоговые суммы в колонках fi и xSRi×fi (ячейки C14, E14).

      5. Рассчитать среднее значение  . Для этого в ячейку E18 ввести формулу [=E14/C14].

      6. В следующих колонках выполнить  вычисления: (xsri -`x )2×fi,  (xsri -`x)3×fi,  (xsri -`x)4×fi. Необходимо помнить, что `x - средняя арифметическая является скалярной величиной, поэтому ссылка на ячейку, содержащую значения `x должна быть абсолютной. Формулы в ячейках F5, G5, H5 будут такими: [=(B5-$F$18)^2*C5], [=(B5-$F$18)^3*C5], [=(B5-$F$18)^4*C5]. Выполнить копирование формул в остальные ячейки колонок таблицы.

      7. Вычислить итоговые суммы в  колонках "(xsri -`x )2×fi",   "(xsri -`x)3×fi",   "(xsri -`x)4×fi". Для этого используется встроенная функция СУММ() или нажать кнопку Автосуммирования.

      8. Рассчитать значения дисперсии d2, среднего квадратического отклонения d, центральных моментов М3, М4, коэффициента асимметрии AS, показателя эксцесса Е. (2.7, 2.8, 2.9, 2.10). Результаты расчета оформляются в виде табл.3.7 рис.2.6. В соответствующие ячейки колонок "значения" записываются следующие формулы: в E19 – [=F14/C14], в E21 – [=КОРЕНЬ(Е19)], в H19 – [=G14/C14], в H20 – [= H14/C14], в H21 – [=H19/E21^3], в H22 – [=H20/E21^4-3].

      9. Рассчитываются значения медианы  Ме и моды Мо. (2.11, 2.12). Т.к. значение частоты fi в i-ой строке таблицы соответствует интервалу [xi-1;xi], то в качестве начала медианного интервала xme и модального интервала xmo берутся значения интервала из предшествующих строк таблицы. В расчетных формулах используются данные xme, xmo из табл. 3.5, расположенной на другом рабочем листе (например ЛИСТ1), то для правильной адресации в расчетных формулах используются консолидированные ссылки. Формулы в ячейках для xme и xmo будут соответственно выглядеть так: в ячейке E22 – [=Лист1!В33+Лист1!G22*(Лист1!G17/2-D7)/C8], в ячейке E23 – [=ЛИСТ1!В32+ЛИСТ1!G22*(C7-C6)/(2*C7-C6-C8)]. 

2.2.1.3. Проверка гипотезы  о нормальном распределении 

интервального ряда 

      1. Исходными данными для проверки  гипотезы являются интервальный  ряд (табл.3.5, рис.2.1.) и статистические  характеристики интервального ряда (табл.3.7, рис.2.6).

      2. Для удобства вычислений составляется  вспомогательная таблица (табл. 3.8), которую можно создать на новом рабочем листе (рис.2.7).

      Значения  колонок xSRi и fi копируются из табл.3.5 (команды: /Правка/копировать и /Правка/специальная вставка/значения).

      3. При малых значениях частот (менее  3) рекомендуется объединять интервалы.  При объединении интервалов частоты складываются и пересчитывается среднее значение переменной в объединенном интервале. В рассматриваемом примере это касается последнего и предпоследнего интервалов. Полученные при объединении средние значения интервалов и частоты представлены в колонках x'SRi и fi'. При объединении в ячейках D12 и E12 записываются следующие формулы [=(B12+B13)/2] и [=C12+C13].

Информация о работе Интервальная группировка