Основные задачи и виды группировок

Автор работы: Пользователь скрыл имя, 30 Января 2016 в 18:35, контрольная работа

Описание работы

Предмет статистических исследований – массовые явления и процессы общественной жизни – обладают многочисленными признаками и свойствами. Обобщить статистические данные, раскрыть наиболее существенные особенности, формы развития массового явления в целом и отдельных его составляющих невозможно без определенных научных принципов обработки данных.

Файлы: 1 файл

основные задачи и виды группировок.doc

— 543.00 Кб (Скачать файл)

 

Основные задачи и виды группировок

 

 

Предмет статистических исследований – массовые явления и процессы общественной жизни – обладают многочисленными признаками и свойствами. Обобщить статистические данные, раскрыть наиболее существенные особенности, формы развития массового явления в целом и отдельных его составляющих невозможно без определенных научных принципов обработки данных. Без преодоления индивидуального многообразия объектов статистического наблюдения общие закономерности развития явления или процесса в целом теряются в деталях и мелочах, отличающих каждый объект один от другого, а предельное обобщение влечет за собой извращенное представление о действительности. Для разделения совокупности единиц на однотипные группы статистика использует метод группировок.

Статистические группировки – первый этап статистической сводки, позволяющий выделить из массы исходного статистического материала однородные группы единиц, обладающих общим сходством в качественном и количественном отношениях. Важно понимать, что группировка – это не субъективный технический прием разделения совокупности на части, а научно обоснованный процесс разделения множества единиц совокупности по определенному признаку.

Основополагающим принципом применения метода группировок является всесторонний, глубокий анализ сущности и природы изучаемого явления, позволяющий определить его типические свойства и внутренние различия. Любая общая совокупность является комплексом частных совокупностей, каждая из которых объединяет явления особого типа, однокачественные в определенном отношении. Каждый тип (группа) имеет специфическую систему признаков с соответствующим уровнем их количественных значений. Установить, к какому типу, в какую частную совокупность нужно отнести группируемые единицы общей совокупности, возможно на основе правильного, четкого определения существенных признаков, по которым должна проводиться группировка. Это второе важное требование научно обоснованной группировки. Третье требование группировки основано на объективном, обоснованном установлении границ групп при условии, что образованные группы должны объединять однородные элементы совокупности, а сами группы (одна по отношению к другой) должны существенно различаться. В противном случае группировка теряет смысл.

Таким образом, на основе применения метода группировок определяются группы по принципу подобия и различия единиц совокупности. Подобие – это однородность единиц в определенных пределах (группах); различие – это их существенное расхождение по группам.

Итак, группировка – разделение общей совокупности единиц по одному или нескольким существенным признакам на однородные группы, различающиеся между собой в качественном и количественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности или проанализировать связи между отдельными признаками. Разнообразие общественных явлений и целей их изучения делает возможным применение большого количества статистических группировок явлений и решение на этой основе самых различных конкретных задач. Основными задачами, решаемыми с помощью группировок, в статистике являются следующие:

• выделение в совокупности изучаемых явлений их социально-экономических типов;

• изучение структуры общественных явлений;

• выявление связей и зависимостей между общественными явлениями.

Все группировки, связанные с выделением в совокупности изучаемых явлений их социально-экономических типов, занимают в статистике центральное место. Эта задача имеет отношение к наиболее существенным, решающим сторонам общественной жизни, например группировка населения по социальному статусу, полу, возрасту, уровню образования, группировка предприятий и организаций по формам собственности, отраслевой принадлежности. Построение подобных группировок за продолжительные периоды позволяет проследить процесс развития социально-экономических отношений. Задача расчленения совокупности общественных явлений по их социально-экономическим типам решается с помощью построения типологических группировок.

Таким образом, типологическая группировка – это разделение качественно разнородной исследуемой совокупности на однородные группы единиц в соответствии с социально-экономическими типами. Примером типологической группировки является группировка по виду участвующих субъектов инновационной деятельности в одном из регионов, которые можно разделить на следующие основные группы взаимоотношений (табл. 3.1).

Таблица 3.1

Группировка субъектов инновационной деятельности

 

Исключительно важное значение придается изучению структуры общественных явлений, т. е. изучению различий в составе какого-либо определенного типа явлений (соотношения между составными частями явления, изменения в этих соотношениях за определенный период времени). Таким образом, структурной группировкой называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку. К структурным группировкам относятся группировка населения по полу, возрасту, уровню образования, группировка предприятий по численности работников, уровню заработной платы, объему работ и т. д. В изменении структуры общественных явлений отражаются важнейшие закономерности их развития. Например, группировка в табл. 3.2 показывает, что в период с 1959 по 1994 г. численность городского населения постоянно увеличивалась, а численность сельского падала, однако в период с 1994 по 2002 г. соотношение этих групп населения не изменилось.

Таблица 3.2

Группировка населения России по месту проживания за 1959–2002 гг.

 

Применение структурных группировок позволяет не только раскрыть структуру совокупности, но и проанализировать изучаемые процессы, их интенсивность, изменение в пространстве, а взятые за ряд периодов времени структурные группировки раскрывают закономерности изменений состава совокупности во времени.

В основу структурных группировок могут быть положены атрибутивный или количественный признаки. Их выбор определяется задачами конкретного исследования и сущностью изучаемой совокупности. Группировка, приведенная в табл. 3.2, построена по атрибутивному признаку. При структурной группировке по количественному признаку возникает необходимость определения числа групп и их границ. Этот вопрос решается в соответствии с задачами исследования. Один и тот же статистический материал может быть разбит на группы различным образом в зависимости от целей и задач исследования. Главное, чтобы в процессе группировки были ярко отражены особенности изучаемого явления и созданы предпосылки для конкретных выводов и рекомендаций. В табл. 3.3 приведена структурная группировка по количественному признаку.

Таблица 3.3

Группировка семей жителей С.-Петербурга по величине среднедушевого дохода (по данным за сентябрь – октябрь 1996 г.)

 

В данной таблице интервалы групп равны по своей величине. Если применяются равные интервалы, то расчет их величины производится по формуле

 

где h – величина интервала, xmax и xmin – максимальные и минимальные значения признаков совокупности, k – число групп.

Следует отметить, что технически удобнее иметь дело с равными интервалами, но это далеко не всегда представляется возможным из-за свойств изучаемых явлений и признаков. В экономике чаще приходится применять неравные, прогрессивно увеличивающиеся интервалы, что обусловлено самой природой экономических явлений.

Применение неравных интервалов объясняется главным образом тем, что абсолютное изменение группировочного признака на одну и ту же величину имеет далеко не одинаковое значение для групп с большим и малым значением признака. Например, между двумя предприятиями с численностью рабочих до 300 человек разница в 100 человек более существенна, чем для предприятий с численностью свыше 10 000 человек.

Интервалы групп могут быть замкнутыыми, когда указаны нижняя и верхняя границы, и открыгтыгми, когда указана лишь одна из границ групп. Открытые интервалы применяются только для крайних групп. При группировке с неравными интервалами желательно образование групп с замкнутыми интервалами. Это способствует точности статистических вычислений.

Одна из целей статистического наблюдения – выыявле-ние связей и зависимостей между общественными явлениями. Важной задачей статистического анализа, проводимого на основе типологической группировки, т. е. в пределах однокачественных совокупностей, является задача изучения и измерения связи между отдельными признаками. Установить факт наличия такой связи позволяет аналитическая группировка.

Аналитическая группировка – распространенный прием статистического изучения связей, которые обнаруживаются при параллельном сопоставлении обобщенных значений признаков по группам. Различают признаки зависимые, значения которых изменяются под влиянием других признаков, их обычно в статистике называют результативными, и факторные, оказывающие влияние на другие. Обычно в основе аналитической группировки лежит признак-фактор, а по результативным признакам производится расчет групповых средних, по изменению величины которых определяют наличие связи между признаками. Таким образом, аналитическими можно назвать такие группировки, которые позволяют установить и изучить связь между результативными и факторными признаками единиц однотипной совокупности.

Важная проблема аналитических группировок – правильный выбор числа групп и определение их границ, что в последующем обеспечивает объективность характеристик связи. Поскольку анализ ведется в однокачественных совокупностях, теоретических оснований для дробления определенного типа нет, поэтому допустима разбивка совокупности на любое число групп, удовлетворяющее определенным требованиям и условиям конкретного анализа. В процессе аналитических группировок следует соблюдать общие правила группировки, т. е. единицы в образованных группах должны быть существенно различны, количество единиц в группах должно быть достаточным для расчета надежных статистических характеристик. Кроме того, групповые средние должны подчиняться определенной закономерности: последовательно увеличиваться или уменьшаться.

Непосредственная группировка данных статистического наблюдения – это первичная группировка. Вторичная группировка – перегруппировка ранее сгруппированных данных. Необходимость вторичной группировки возникает в двух случаях:

• ранее произведенная группировка не удовлетворяет целям исследования в отношении числа групп;

• для сравнения данных, относящихся к различным периодам времени или к различным территориям, если первичная группировка была произведена по разным группи-ровочным признакам или по разным интервалам.

Существует два способа вторичной группировки:

• объединение мелких групп в более крупные;

• выделение определенной доли единиц совокупности.

В научно обоснованной группировке общественных явлений необходимо учитывать взаимозависимость явлений и возможность перехода постепенных количественных изменений в явлениях к коренным качественным изменениям. Группировка может быть научной лишь в том случае, если не только определены познавательные цели группировки, но и правильно выбрано основание группировки – группи-ровочный признак. Если группировка – это распределение на однородные группы по какому-либо признаку или объединение отдельных единиц совокупности в группы, однородные по какому-либо признаку, то группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в отдельные группы.

При выборе группировочного признака важным является не способ выражения признака, а его значение для изучаемого явления. С этой точки зрения для группировки следует брать существенные признаки, выражающие наиболее характерные черты изучаемого явления.

Самая простая группировка – ряд распределения. Рядами распределения называются ряды чисел (цифр), характеризующие состав или структуру какого-либо явления после группировки статистических данных об этом явлении, другими словами, это группировка, в которой для характеристики групп применяется один показатель – численность группы. Пример использование ряда распределения приведен в табл. 3.4.

Таблица 3.4

Применение рядов распределения

 

Приведенный ряд распределения содержит три элемента: разновидность атрибутивного признака (мужчины, женщины); численность единиц в каждой группе, называемая частотами ряда распределения; численность групп, выраженная в долях (процентах) от общей численности единиц, называемая частостями. Сумма частостей равна 1, если они выражены в долях единицы, и равна 100 %, если они выражены в процентах.

Ряды, построенные по атрибутивному признаку, называют атрибутивными.

Ряды распределения, построенные по количественному признаку, называются вариационныыми рядами. Числовые значения количественного признака в вариационном ряду распределения называются вариантами и располагаются в определенной последовательности. Варианты могут выражаться числами положительными и отрицательными, абсолютными и относительными. Вариационные ряды делятся на дискретные и интервальные.

Дискретныге вариационныге рядыг характеризуют распределение единиц совокупности по дискретному (прерывному) признаку, т. е. принимающему целые значения. При построении ряда распределения с дискретной вариацией признака все варианты выписываются в порядке возрастания их величины, подсчитывается, сколько раз повторяется одна и та же величина варианта, т. е. частота, и записывается в одной строке с соответствующим значением варианта, например распределение семей по числу детей (табл. 3.5).

Частоты в дискретном вариационном ряду, как и в атрибутивном, могут быть заменены частостями.

Таблица 3.5

Применение дискретного ряда распределения

 

В случае непрерывной вариации величина признака может принимать любые значения в определенном интервале, например распределение работников фирмы по уровню дохода (табл. 3.6).

Таблица 3.6

Случай непрерывной вариации

 

При построении интервального вариационного ряда необходимо выбрать оптимальное число групп (интервалов признака) и установить длину интервала. Оптимальное число групп выбирается так, чтобы отразить многообразие значений признака в совокупности. Чаще всего число групп устанавливается по формуле

k = 1 + 3,32lg N = 1,44ln N + 1,

где k – число групп; N – численность совокупности.

Например, необходимо построить вариационный ряд сельскохозяйственных предприятий по урожайности зерновых культур. Число сельскохозяйственных предприятий – 143. Как определить число групп?

k = 1 + 3,32lg N = 1 + 3,32lg143 = 8,16.

Число групп может быть только целым числом, в данном случае – 8 или 9.

Пример. Минимальная урожайность составляет 30 ц/га, максимальная – 70 ц/га, а число намеченных групп – 10. Величину интервала можно рассчитать по формуле (3.1):

 

Если полученная группировка не удовлетворяет требованиям анализа, то можно произвести перегруппировку. Не следует стремиться к очень большому количеству групп, так как в такой группировке часто исчезают различия между группами. Также надо избегать образования и слишком малочисленных групп, включающих несколько единиц совокупности, потому что в таких группах перестает действовать закон больших чисел и возможно проявление случайности. Когда не удается сразу наметить возможные группы, собранный материал сначала разбивают на значительное количество групп, а затем укрупняют их, уменьшая количество групп и создавая качественно однородныле группыл.

Таким образом, группировки во всех случаях должны быть построены так, чтобы образованные в них группы как можно полнее отвечали действительности, были видны различия между группами и в одну группу не объединялись существенно различающиеся между собой явления.


 

Изучаемые статистикой массовые явления и процессы протекают в множествах элементов (единиц) некоторого вида, или совокупностях. Определить совокупность – значит определить входящие в нее элементы, то есть единицы. Структура совокупности показывает, как единицы разграничиваются друг с другом, т.е. под структурой понимается характер распределения единиц совокупности для каждого признака и характер взаимосвязи признаков между собой.

В простейших случаях массовое явление протекает в одной совокупности. В более сложных в рамках самой совокупности существуют качественно различные частные совокупности, без разграничения которых невозможно разобраться в массовом явлении. Так, если единицей совокупности отрасли «Пищевая промышленность» является предприятие, то в составе предприятия действуют совокупности работников, оборудования. Состав совокупности по таким качественно различным частям, играющим разную роль в исследуемом массовом явлении, представляет собой одну из важнейших характеристик структуры этой совокупности.

Каждая совокупность должна объединять качественно однородные элементы, играющие в рассматриваемом массовом явлении вполне определенную роль. Выделение и анализ однородных частных подсовокупностей выполняют с помощью методов группировки.

Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку или объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Устойчивое разграничение объектов называется классификацией. Классификация – это как бы стандарт, в котором каждая атрибутивная запись может быть отнесена лишь к одной группе или подгруппе. Классификация основывается на самых существенных признаках, которые меняются очень мало (например, международная стандартная отраслевая классификация, классификация отраслей народного хозяйства, классификация основных фондов и т. д.). Таким образом, классификация – это узаконенная, общепринятая, нормативная группировка. Объекты, попавшие в процессе классификации в одну классификационную категорию, могут подвергнуться дальнейшей классификации.

Метод группировки основывается на двух категориях – группировочном признаке и интервале.

Группированный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Классификация и группировка должны производиться на основании вполне объективных и легко распознаваемых признаков. При этом последние могут носить как атрибутивный, так и количественный характер. Следует иметь в виду, что в ряде случаев классификация, которая представляется чисто качественной, в конечном итоге оказывается основанной на количественном признаке. Такова, например, классификация промышленных предприятий по отраслям. Поскольку одно и то же предприятие выпускает продукцию разных видов, статистика решает этот вопрос по количественному преобладанию того или иного вида.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе. Интервалы бывают:

– равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;

– неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;

– открытые, когда имеется только либо верхняя, либо нижняя граница;

– закрытые, когда имеются и нижняя, и верхняя границы.

Статистические группировки и классификации преследуют цели выделения качественно однородных совокупностей, изучения структуры совокупности, исследования существующих зависимостей. Каждой из этих целей соответствует особый вид группировки: типологическая, структурная, аналитическая (факторная). Так, типологическая группировка решает задачу выявления и характеристики социально-экономических типов (частных подсовокупностей), структурная позволяет описать составные части совокупности или строение типов, а также проанализировать структурные сдвиги, а аналитическая (факторная) группировка – оценить связи между взаимодействующими признаками.

В зависимости от числа положенных в основание группировки признаков различают простые и многомерные группировки.

Простой называется группировка, выполненная по одному признаку. Среди простых группировок особо выделяются ряды распределения.

Ряд распределения – это группировка, в которой для характеристики групп (упорядочение расположенных по значению признака) применяется один показатель – численность группы. Ряды, построенные по атрибутивному признаку, называются атрибутивными рядами распределения. Ряды распределения, построенные по количественному признаку, называются вариационными рядами.

Многомерная группировка производится по двум и более признакам. Частным случаем многомерной группировки является комбинационная группировка, базирующаяся на двух и более признаках, взятых во взаимосвязи, в комбинации. По отношениям между признаками выделяют:

– иерархические группировки, выполняемые по двум и более признакам, при этом значения второго признака определяются областью значений первого (например, классификация отраслей промышленности по подотраслям);

– неиерархические группировки, которые строятся, когда строгой зависимости значений второго признака от первого не существует.

По очередности обработки информации группировки бывают первичные (составленные на основе первичных данных) и вторичные, являющиеся результатом перегруппировки ранее уже сгруппированного материала.

В соответствии с временным критерием различают статические группировки, дающие характеристику совокупности на определенный момент времени или за определенный период, и динамические – группировки, показывающие переходы единиц из одних групп в другие (а также вход и выход из совокупности). Количества таких переходов, рисующие внутреннюю динамику совокупности, удобно расположить в «шахматную» таблицу, которую называют матрицей перехода (часто ее называют также миграционной или матрицей мобильности).

При проведении группировки решается ряд задач:

– выделение группировочного признака;

– определение числа групп и величины интервалов;

– при наличии нескольких группировочных признаков описание того, как они комбинируются между собой;

– установление показателей, которыми должны характеризоваться группы, т. е. сказуемого группировки.

Вопрос о числе групп и величине интервала следует решать с учетом множества обстоятельств, исходя из целей исследования, значения признака и т. д. Количество групп во многом зависит от того, какой признак служит основанием группировки. Так, нередко атрибутивные группировочные признаки определяют число групп (группировка работников по категориям, заболеваемость по видам болезней). Также расчленяется совокупность по дискретному признаку, изменяющемуся в незначительном диапазоне (группировка семей – по числу их членов и др.).

Интервалы устанавливаются только при значительной колеблемости дискретного признака и при непрерывно изменяющемся количественном признаке. Интервалы задают критические точки перехода одного качества в другое. При построении типологической группировки интервалы должны быть неравными и специализированными. Специализация интервалов означает, что разным значениям одного признака соответствуют разные значения другого. При структурных группировках используют, как правило, равные интервалы.

Правильное установление числа групп, величины интервалов имеют первостепенное значение в практике группировок статистических данных для образования качественно однородных групп. Здесь необходимо учитывать несколько условий:

а) число групп, величина интервалов детерминируются уровнем колеблемости группировочного признака: чем значительнее вариация признака, тем больше при прочих равных условиях должно быть групп;

б) число групп должно отражать реальную структуру изучаемой совокупности;

в) не допускается выделение пустых групп. Если проблема пустых групп все же возникает, при проведении структурных группировок используют неравные интервалы.

В случае равных интервалов величина интервала может быть определена как

 

,


где  – максимальное значение признака;  – минимальное

 значение признака; k – число групп.

Для нахождения числа групп (для ориентировки) используется формула Стерджесса

 

k  = 1+3,322 lg n ,


где n – количество элементов совокупности. В общем случае число групп неизвестно и определяется опытным путем, на основе перебора вариантов группировки, выявления такого варианта, который наилучшим образом позволяет увидеть различия между группами.

Для характеристики групп определяется система показателей. Обязательным показателем является численность групп. Он может быть представлен либо частотой  (количеством единиц в каждой группе), либо частостью = / (удельным весом каждой группы). Разрабатываются также интегральные показатели.

Результаты сводки и группировки данных статистического наблюдения оформляются в виде статистических рядов распределения и таблиц.

Элементами распределения являются варианты (названия или количественные выражения группировочного признака) и частота. Ряды, построенные по признакам, измеренным в номинальной и порядковой шкалах, называются атрибутивными, а ряды распределения, построенные для признаков, измеренных в количественных шкалах (интервальной и отношений), – вариационными.

Количественные признаки могут выражаться дискретными или непрерывными величинами, соответственно, и вариационный ряд будет либо дискретным, либо интервальным (непрерывным в пределах интервала). Так, количество детей в семье может выражаться только целыми числами, а вес человека может отличаться от веса другого на сколь угодно малую величину, определяемую точностью измерения.

Для характеристики распределения используют также накопленные частоты. Если вместо абсолютных частот взять частости, то аналогично получим накопленные частости. Накопленная частота (частость) для данного варианта или для верхней границы данного интервала получается суммированием (накапливанием) частот (частостей) всех предшествующих интервалов, включая данный. Накопленная частота показывает, какое число единиц имеет значение признака, не большее данной варианта или верхней границы интервала. Ряды распределения преобразуются в кумулятивные ряды и графически изображаются в виде кумуляты (кривой сумм). По оси ординат наносится накопленная частота.

Одним из важнейших требований, предъявляемых к статистическим рядам распределения, является обеспечение сравнимости их во времени и пространстве. Вариационные ряды с равными интервалами обеспечивают это условие. Для вариационных рядов с неравными интервалами  в целях правильного представления о характере распределения необходимо рассчитать абсолютную  или относительную  плотность  распределения – отношение частот или частостей к величине интервала

Информация о работе Основные задачи и виды группировок