Статистический анализ распределения регионов России по соотношению мужчин и женщин (на 1000 мужчин приходится женщин) в 2009 году

Автор работы: Пользователь скрыл имя, 12 Января 2012 в 13:19, курсовая работа

Описание работы

В данной курсовой работе рассматривается реализация анализа распределений с использованием программы Statistica.
Ряд распределения – это распределение единиц совокупности по значению того или иного признака в конкретных условиях места и времени. Исходя из этого определения, любой ряд распределения состоит из двух элементов: значение признака (вариант) и соответствующая частота (характеризует, сколько единиц совокупности обладает данным значением признака).

Содержание работы

Введение…………………………………………………………………………...3
1. Анализ эмпирического распределения………………………………………..4
Графическое и табличное представление вариационного ряда распределения………………………………………………………………….6
2. Характеристика центральной тенденции распределения…………………..10
3. Оценка вариации изучаемого признака……………………………………...13
4. Характеристика структуры распределения ………………………………...15
5. Характеристика формы распределения……………………………………..15
Заключение…………………………………………………………………….....18
Список литературы……………………………

Файлы: 1 файл

курсовик.doc

— 346.50 Кб (Скачать файл)

Министерство  образования и науки Российской Федерации

Государственное образовательное учреждение высшего  профессионального образования

Санкт-Петербургский  Государственный Политехнический Университет

Факультет экономики и менеджмента 

Кафедра «Финансы и денежное обращение» 
 
 
 
 

Курсовая  работа

по дисциплине «Статистика»

на тему: «Статистический анализ распределения регионов России по соотношению мужчин и женщин (на 1000 мужчин приходится женщин) в 2009 году» 
 
 
 
 
 

                                                      Работу выполнила:

                                                      студентка группы Ф-25 

                                                      _____________ 

                                                      Богданова И.Ю. 
 

                                                      Работу приняла:

                                                      доцент 

                                                      _____________ 

                                                      Пономарева О. А. 
 
 

Санкт-Петербург

2011

 

Содержание 
 

Введение…………………………………………………………………………...3

1. Анализ  эмпирического распределения………………………………………..4

    1. Графическое и табличное представление вариационного ряда распределения………………………………………………………………….6

2. Характеристика  центральной тенденции распределения…………………..10

3. Оценка  вариации изучаемого признака……………………………………...13

4. Характеристика  структуры  распределения ………………………………...15

5.  Характеристика формы распределения……………………………………..15

Заключение…………………………………………………………………….....18

Список литературы………………………………………………………………19

 

    Введение 

      В курсовой работе будет построен и  исследован ряд распределения регионов России по соотношению мужчин и женщин (на 1000 мужчин приходится женщин) в 2009 году.

     В данной курсовой работе рассматривается  реализация анализа распределений  с использованием программы Statistica.

     Ряд распределения – это распределение единиц совокупности по значению того или иного признака в конкретных условиях места и времени. Исходя из этого определения, любой ряд распределения состоит из двух элементов: значение признака (вариант) и соответствующая частота (характеризует, сколько единиц совокупности обладает данным значением признака).

     Ряд распределения в настоящей работе был построен на основе показателей  соотношения мужчин и женщин в 2009 году.

     Исходные  данные были взяты из сборника Росстата «Регионы России. Социально-экономические показатели» таблицы 3.5 «Соотношение мужчин и женщин (на 1000 мужчин приходится женщин) в 2009 году» (таблица 1).

     Все расчеты и построение графиков реализуются  с помощью программы Statsoft Statistica v7.0.61.0 . 

 

Таблица 1

Соотношение мужчин и женщин (на 1000 мужчин приходится женщин) в 2009 году

№ региона Число женщин на 1000 мужчин № региона Число женщин на 1000 мужчин № региона Число женщин на 1000 мужчин № региона Число женщин на 1000 мужчин № региона Число женщин на 1000 мужчин
1 1182 18 1106 35 1152 52 1144 69 1145
2 1210 19 1187 36 1129 53 1203 70 1163
3 1233 20 1113 37 1064 54 1183 71 1169
4 1204 21 1147 38 1157 55 1190 72 1174
5 1245 22 1060 39 1150 56 1186 73 1170
6 1202 23 1183 40 1132 57 1185 74 1142
7 1204 24 1123 41 1166 58 1179 75 1068
8 1211 25 1178 42 1169 59 1079 76 986
9 1203 26 1069 43 1144 60 1043 77 1093
10 1188 27 1246 44 1162 61 1017 78 1095
11 1213 28 1210 45 1182 62 1179 79 1102
12 1213 29 1232 46 1170 63 1109 80 1079
13 1228 30 1153 47 1178 64 1118 81 1095
14 1206 31 1074 48 1163 65 1113 82 1077
15 1234 32 1138 49 1179 66 1149 83 949
16 1244 33 1141 50 1180 67 1161    
17 1236 34 1103 51 1221 68 1093    
 
 
 

1. Анализ эмпирического распределения.

     Построение  рядов распределения начинается с ранжирования данных.

Ранжирование  вариационного ряда – это расположение единиц совокупности в порядке возрастания или убывания значений признака.

     Анализ  распределений направлен на выявление  частот в зависимости от значений варьирующего признака и изучение различных  характеристик распределения.

     Прежде, чем приступить к вычислению статистических показателей, необходимо из исходной совокупности исключить единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Построение ранжированного ряда позволяет увидеть наличие или отсутствие выбросов.

     Выбросы – это единицы совокупности, значения признака которых резко отличаются как в большую, так и в меньшую сторону от значений признака у основной части единиц совокупности.

     Для удобства локализации и устранения выбросов необходимо ранжировать исходные данные. В нашем примере, как выброс, удаляется первые  2 значения ранжированной совокупности, таким образом, окончательный объем совокупности составляет 81 единица (таблица 1.1).

     После сортировки по возрастанию получим  рабочий ряд (рис.1.1)

 
 
 
 
 
 

 
 
 
 
 
 
 
 
 
 
 
 

Рис. 1.1. Вид начала и конца рабочего листа с ранжированной переменной 

Таблица 1.1

Исходные  данные, ранжированные по возрастанию  значений признака

№ региона Число женщин на 1000 мужчин № региона Число женщин на 1000 мужчин № региона Число женщин на 1000 мужчин № региона Число женщин на 1000 мужчин № региона Число женщин на 1000 мужчин
1 1017 18 1109 35 1153 52 1180 69 1210
2 1043 19 1113 36 1157 53 1182 70 1211
3 1060 20 1113 37 1161 54 1182 71 1213
4 1064 21 1118 38 1162 55 1183 72 1213
5 1068 22 1123 39 1163 56 1183 73 1221
6 1069 23 1129 40 1163 57 1185 74 1228
7 1074 24 1132 41 1166 58 1186 75 1232
8 1077 25 1138 42 1169 59 1187 76 1233
9 1079 26 1141 43 1169 60 1188 77 1234
10 1079 27 1142 44 1170 61 1190 78 1236
11 1093 28 1144 45 1170 62 1202 79 1244
12 1093 29 1144 46 1174 63 1203 80 1245
13 1095 30 1145 47 1178 64 1203 81 1246
14 1095 31 1147 48 1178 65 1204    
15 1102 32 1149 49 1179 66 1204    
16 1103 33 1150 50 1179 67 1206    
17 1106 34 1152 51 1179 68 1210    
 
 
    1.   Графическое и табличное представление вариационного ряда распределения

     Следующим шагом является группировка по количественному  непрерывному признаку и построение вариационного ряда распределения.

     Вариационным называется ряд распределения, построенный по количественному признаку. Он может быть представлен в виде таблицы и графически. Табличное представление позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.

     При этом величина группировочного интервала определяется по формуле: 

     

     где h – величина группировочного интервала, Xmin и Xmax – минимальное и максимальное значения признака совокупности.

     В данной задаче k = 6 , предполагаемая величина группировочного интервала равна примерно h = 38. Далее построена таблица распределения (рис. 1.1.1).

                                                     

 

Рис. 1.1.1 Распределение регионов России по значению показателя «Число женщин на 1000 мужчин в 2009 году» 

     На  основе таблицы построим график, наглядно представляющий закономерность распределения анализируемой статистической совокупности.

     Для изображения вариационного ряда используются графики:

- гистограмма  (рис. 1.1.2)

- полигон (рис. 1.1.3)

- кумулята (рис. 1.1.4, 1.1.5) 

 

Рис. 1.1.2 Гистограмма распределения регионов России по значению показателя «Число женщин на 1000 мужчин в 2009 г.»

Рис. 1.1.3 Полигон распределения регионов России по значению показателя «Число женщин на 1000 мужчин в 2009 г.» 
 

 

Рис. 1.1.4 Кумулята распределения регионов России по значению показателя «Число женщин на 1000 мужчин в 2009 г.» (абсолютные частоты) 

 

Рис. 1.1.5 Кумулята распределения регионов России по значению показателя «Число женщин на 1000 мужчин в 2009 г.» (относительные частоты) 
 

    1. Характеристика  центральной тенденции  распределения
 

         Статистический  анализ вариационных рядов распределения  предполагает расчет характеристик  центра распределения, его структуры, оценку степени вариации и дифференциации изучаемого признака, изучение формы распределения.

         В качестве показателей центральной  тенденции распределения используются:

         - среднее арифметическое значение;

         - мода;

         - медиана.

         Основными показателями вариации являются: размах вариации, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Для характеристики структуры распределения используются следующие показатели: медиана, квартили, децили и прочие процентили. Изучение формы распределения предполагает оценку асимметрии и эксцесса (куртозиса). Перечисленные показатели имеют самостоятельное аналитическое значение, поскольку отражают разные свойства изучаемой совокупности, а все вместе они позволяют получить комплексную характеристику эмпирического распределения.

         Результаты  расчета основных статистических характеристик представлены на рис. 2.1 

Рис.2.1 Основные характеристики распределения регионов России по значению показателя «Число женщин на 1000 мужчин в 2009 г.» 
 

     Характеристика  центрального распределения включает в себя расчёт и анализ центра распределения, вычисление среднего арифметического значения, моды и медианы.

      Средняя арифметическая характеризует типический уровень признаков совокупности. 

     Средняя арифметическая величина – отношение объема признака к объему совокупности.

     Данная  средняя используется для расчета  средних значений абсолютных показателей по несгруппированным данным.

      В рассматриваемом нами распределении  средняя арифметическая равна Mean =1157,037.

   Это означает, что в среднем по России в 2009 году число женщин на 1000 мужчин составляет 1157.

Информация о работе Статистический анализ распределения регионов России по соотношению мужчин и женщин (на 1000 мужчин приходится женщин) в 2009 году