Автор работы: Пользователь скрыл имя, 11 Ноября 2009 в 17:11, Не определен
Организация и задачи статистики на современном этапе.
Основной сферой
ее применения является измерение вариации
признака в совокупности (расчет среднего
квадратического отклонения).
Формула простой средней квадратической
Формула взвешенной средней квадратической
18. Статистический анализ структуры. Структурные средние: мода и медиана.
Для определения
структуры совокупности используют
особые средние показатели, к которым
относятся медиана и мода, или так называемые
структурные средние. Если средняя арифметическая
рассчитывается на основе использования
всех вариантов значений признака, то
медиана и мода характеризуют величину
того варианта, который занимает определенное
среднее положение в ранжированном вариационном
ряду.
Медиана (Ме) - это
величина, которая соответствует
варианту, находящемуся в середине
ранжированного ряда.
Для ранжированного
ряда с нечетным числом индивидуальных
величин (например, 1, 2, 3, 3, 6, 7, 9, 9, 10) медианой
будет величина, которая расположена в
центре ряда, т.е. пятая величина.
Для ранжированного
ряда с четным числом индивидуальных
величин (например, 1, 5, 7, 10, 11, 14) медианой
будет средняя арифметическая величина,
которая рассчитывается из двух смежных
величин. Для нашего случая медиана равна
(7+10) : 2= 8,5.
То есть для нахождения медианы сначала необходимо определить ее порядковый номер (ее положение в ранжированном ряду) по формуле
где n - число единиц в совокупности.
Численное значение
медианы определяют по накопленным
частотам в дискретном вариационном
ряду. Для этого сначала следует
указать интервал нахождения медианы
в интервальном ряду распределения.
Медианным называют первый интервал,
где сумма накопленных частот
превышает половину наблюдений от общего
числа всех наблюдений.
Численное значение медианы обычно определяют по формуле
где xМе - нижняя
граница медианного интервала; i - величина
интервала; S-1 - накопленная частота
интервала, которая предшествует медианному;
f - частота медианного интервала.
Модой (Мо) называют
значение признака, которое встречается
наиболее часто у единиц совокупности.
Для дискретного ряда модой будет
являться вариант с наибольшей частотой.
Для определения моды интервального
ряда сначала определяют модальный интервал
(интервал, имеющий наибольшую частоту).
Затем в пределах этого интервала находят
то значение признака, которое может являться
модой.
Чтобы найти конкретное значение моды, необходимо использовать формулу
где xМо - нижняя
граница модального интервала; iМо - величина
модального интервала; fМо - частота модального
интервала; fМо-1 - частота интервала, предшествующего
модальному; fМо+1 - частота интервала, следующего
за модальным.
Мода имеет
широкое распространение в
19. Ряды распределения, их виды и приемы построения.
Важнейшей частью
статистического анализа является построение
рядов распределения (структурной группировки)
с целью выделения характерных свойств
и закономерностей изучаемой совокупности.
В зависимости от того, какой признак (количественный
или качественный) взят за основу группировки
данных, различают соответственно типы
рядов распределения.
Если за основу
группировки взят качественный признак,
то такой ряд распределения
Если ряд распределения
построен по количественному признаку,
то такой ряд называют вариационным.
Построить вариационный ряд - значит
упорядочить количественное распределение
единиц совокупности по значениям признака,
а затем подсчитать числа единиц
совокупности с этими значениями (построить
групповую таблицу).
Выделяют три
формы вариационного ряда: ранжированный
ряд, дискретный ряд и интервальный
ряд.
Ранжированный
ряд - это распределение отдельных
единиц совокупности в порядке возрастания
или убывания исследуемого признака. Ранжирование
позволяет легко разделить количественные
данные по группам, сразу обнаружить наименьшее
и наибольшее значения признака, выделить
значения, которые чаще всего повторяются.
Другие формы
вариационного ряда - групповые таблицы,
составленные по характеру вариации значений
изучаемого признака. По характеру вариации
различают дискретные (прерывные) и непрерывные
признаки.
Дискретный ряд
- это такой вариационный ряд, в
основу построения которого положены
признаки с прерывным изменением (дискретные
признаки). К последним можно отнести тарифный
разряд, количество детей в семье, число
работников на предприятии и т.д. Эти признаки
могут принимать только конечное число
определенных значений.
Дискретный вариационный
ряд представляет таблицу, которая состоит
из двух граф. В первой графе указывается
конкретное значение признака, а во второй
- число единиц совокупности с определенным
значением признака.
Если признак
имеет непрерывное изменение (размер
дохода, стаж работы, стоимость основных
фондов предприятия и т.д., которые в определенных
границах могут принимать любые значения),
то для этого признака нужно строить интервальный
вариационный ряд.
Групповая таблица
здесь также имеет две графы.
В первой указывается значение признака
в интервале «от - до» (варианты), во второй
- число единиц, входящих в интервал (частота).
Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается
где k - число вариантов значений
признака
Очень часто
таблица дополняется графой, в
которой подсчитываются накопленные
частоты S, которые показывают, какое
количество единиц совокупности имеет
значение признака не большее, чем данное
значение.
Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.:
При построении вариационного ряда с интервальными значениями прежде всего необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп m:
где R = xmax - xmin ; m = 1 + 3,322 lgn (формула Стерджесса); n - общее число единиц совокупности.
20.
Графическое изображение
статистических данных.
Понятие о статистическом
графике. Элементы статистического
графика.
21. Классификация видов графиков.
Для изображения рядов распределения существует 3 основные вида графиков:
22. Гистограмма распределения. Правила построения. Свойства.
Для графического изображения интервальных вариационных рядов применяется гистограмма. Она строится так: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам интервала.
К примеру,
частота | интервалы |
12 | 200-400 |
17 | 400-600 |
15,5 | 600-800 |
По гистограмме можно определить моду – наиболее часто встречающееся значение признака у единиц данной совокупности.
Модальным считается интервал, которому соответствует максимальное значение частоты.
Для нахождения моды графически на гистограмме, нужно соединить линии, как показано на рисунке, и опустить перпендикуляр из построенного прямоугольника вниз к оси абсцисс (интервалы).
Мо = Хмо + i * (fmo – (fmo-1))/(fmo-1)+(fmo+1)
Мо=400+200*((17-12)/((17-12)+(
23. Полигон распределения частот. Правила построения. Свойства.
Для построения полигона распределения частот, соединяем середины столбцов гистограммы.
24. Кумулятивная кривая. Правила построения. Свойства.
Для построения этой кривой нужно рассчитать накопленные частоты, определяющиеся суммированием частот интервалов. Причем, последняя накопленная частота должна оказаться равной сумме всех частот. При построении кумуляты нижняя граница первого интервала будет равна нулю, а верхняя граница – вся частота данного интервала.
частота | интервалы |
накопленная
частота |
12 | 200-400 | 12 |
17 | 400-600
модальный интервал медианный интервал |
12+17=29 |
15,5 | 600-800 | 29+15,5=44,5 |
Итого: 44,5 |
По кумулятивной кривой можно определить медиану.
Медианным является интервал, в котором значение накопленной частоты превышает значение показателя места медианы.
Место медианы ( Nме) =(n+1)/2
К примеру, (44,5+1)/2=22,75
Превышающие значение накопленной частоты = 29>22.75, поэтому медианный интервал –
[400-600].
Ме = Хме + i * (((n+1)/2)-S(-1))/fme
Me=400+200*((22,75-12)/17)=
25. Показатели центра распределения вариационного ряда (средняя, мода, медиана).
1.Средняя арифметическая – значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности.
Для дискретного ряда –
Х (сред.)=∑хifi/∑fi
Для интервального ряда –
Х (сред.)=∑х´ifi/∑fi
2. Мода – наиболее часто встречающееся значение признака у единиц данной совокупности.
Модальным считается интервал, которому соответствует максимальное значение частоты.
Хмо – это нижняя граница модального интервала
Fmo – частота модального интервала
fmo-1 – частота интервала, предшествующая модальному
fmo+1 – частота интервала следующего за модальным
Мо = Хмо + i * (fmo – (fmo-1))/(fmo-1)+(fmo+1)
3. Медиана.
Медианным является интервал, в котором значение накопленной частоты превышает значение показателя места медианы.
Место медианы ( Nме) =(n+1)/2
Хме – нижняя граница медианного интервала
N – количество единиц в совокупности