Статистический анализ распределения регионов России по соотношению мужчин и женщин (на 1000 мужчин приходится женщин) в 2009 году

Автор работы: Пользователь скрыл имя, 12 Января 2012 в 13:19, курсовая работа

Описание работы

В данной курсовой работе рассматривается реализация анализа распределений с использованием программы Statistica.
Ряд распределения – это распределение единиц совокупности по значению того или иного признака в конкретных условиях места и времени. Исходя из этого определения, любой ряд распределения состоит из двух элементов: значение признака (вариант) и соответствующая частота (характеризует, сколько единиц совокупности обладает данным значением признака).

Содержание работы

Введение…………………………………………………………………………...3
1. Анализ эмпирического распределения………………………………………..4
Графическое и табличное представление вариационного ряда распределения………………………………………………………………….6
2. Характеристика центральной тенденции распределения…………………..10
3. Оценка вариации изучаемого признака……………………………………...13
4. Характеристика структуры распределения ………………………………...15
5. Характеристика формы распределения……………………………………..15
Заключение…………………………………………………………………….....18
Список литературы……………………………

Файлы: 1 файл

курсовик.doc

— 346.50 Кб (Скачать файл)

     Мода – это наиболее часто встречающееся значение показателя распределения (Mode).

     

В данном случае модальный интервал  1169 <Х<= 1207, h=38,

  =67, fMo-1=41, fM0+1=81

Отсюда  М0 = 1289.

 Это означает, что наиболее часто встречающееся число женщин на 1000 мужчин  по России в 2009 году составляет 1289. 

     Медиана – это значение показателя у единицы совокупности, делящий ранжированный ряд пополам. Значение медианы характеризует структуру изучаемой совокупности, указывая, что 50% единиц имеют значения признака меньше медианного и 50% - больше медианного.

     При определении медианы по ранжированному ряду порядковый номер единицы, значение признака которой является медианой, определяется как 

.

     Если  число единиц совокупности четное и  порядковый номер – дробное значение, то значение медианы определяется как среднее арифметическое значений признака у двух центральных единиц. 

      В рассматриваемом нами распределении, значение медианы равно   Median = 1166.

   Это значит, что у 50% регионов России в 2009 году число женщин на 1000 мужчин было выше 1166, а у 50% - ниже этого значения. 

    1. Оценка  вариации изучаемого признака
 

    Вариация – различия в индивидуальных значениях признака у единиц совокупности. От степени вариации признака в совокупности зависит типичность, надежность показателей центра распределения. Чем меньше вариация, тем в большей степени среднее значение выполняет функцию характеристики типического уровня признака. 

    Абсолютные  показатели (измеряются в тех же единицах, что и изучаемые показатели): 

    Размах  вариации (R) рассчитывается как разность между максимальным (Xmax) и минимальным (Xmin) значениями признака в совокупности:

Показатель  характеризует, насколько максимальное значение признака превышает минимальное.

В нашем  случае размах вариации равен Range = 229.

    Размах  вариации показывает, что регион, с  наибольшим числом женщин отличается от региона с наименьшим числом женщин на 229 женщин на 1000 мужчин. 

Дисперсия – характеристика рассеивания значений случайной величины, измеряемая квадратом их отклонений от среднего значения.

 

В рассматриваемом  нами распределении значение дисперсии 

Variance =  2787,6.

     Показатель  дисперсии в экономических исследованиях  содержательно не интерпретируется, но благодаря своим свойствам широко используется для расчета многих статистических характеристик (например, для расчета стандартного отклонения).

     Среднее квадратическое отклонение случайной величины Х называется квадратный корень из дисперсии.

            В рассматриваемом нами распределении значение среднего квадратического отклонения равно Standart deviation=52,8.

     Стандартная ошибка выборки – это отклонение суммарного измерения выборки от параметров генеральной совокупности.

     Показатель  среднего квадратического отклонения – наиболее часто используемый абсолютный показатель вариации. Он характеризует, насколько в среднем отклоняются индивидуальные значения признака от типического (среднего) уровня признака по совокупности, т.е. в абсолютном выражении оценивает степень рассеянности индивидуальных значений признака вокруг среднего. Чем меньше значение стандартного отклонения, тем устойчивее средняя величина.

     Полученный  результат говорит о том, что число женщин на 1000 мужчин каждого региона в среднем отклоняется на 52,8 от среднего уровня по России в 2009 г.

В рассматриваемом  нами распределении значение стандартной ошибки выборки равно 5,8. 

    1. Характеристика  структуры  распределения
 

      Характеристика  структуры распределения подразумевает  расчёт и анализ показателей: медиана, квартили, децили. Медиана была посчитана в разделе 2.

      Квартили – это значения случайной переменной, делящие распределение на 4 равные по объему части. 

           В нашем случае нижний квартиль равен Lower  = 1118, верхний квартиль Upper  = 1190, межквартильный размах  Quartile = 72 .

       Полученные  результаты говорят о том, что у 25% регионов число женщин на 1000 мужчин меньше  1118, а у 75% - больше этого значения; у 75% регионов число женщин на 1000 мужчин меньше 1190, а у 25% - больше. 

    1. Характеристика  формы распределения
 

     Показатели  формы распределения помогают понять, как распределены единицы совокупности относительно центра распределения. К показателям формы распределения относятся: коэффициент асимметрии и коэффициент эксцесса, стандартизованная асимметрия, стандартизованный эксцесс.         

     Характеристика  формы распределения подразумевает  расчёт и анализ показателей: коэффициент  асимметрии, коэффициент эксцесса (куртозис).

     Коэффициент асимметрии.

     Коэффициент асимметрии – оценивает асимметрию в центре

распределения и на его концах. Предложен Пирсоном, основывается на сравнении  показателей  центра распределения: 

     

     

   В нашем  случае коэффициент асимметрии равен Skewness = -0,444852, стандартизованная ошибка асимметрии равна Std.err. = 0,267302

   Стандартизованная асимметрия равна 0,7 , что меньше 3, значит в нашем случае асимметрия несущественная и сформирована под влиянием случайных факторов.

   В исследуемом случае < MO, значит, асимметрия является отрицательной (левосторонней). Т.е. чаще встречаются большие значения. Это значит, что по районам России число женщин на 1000 мужчин встречается чаще больше по значению, чем среднее число женщин на 1000 мужчин по всем регионам.

     Коэффициент эксцесса (куртозис).

     Этот  показатель характеризует выпад вершины эмпирического распределения вверх или вниз относительно кривой нормального распределения. Эксцесс оценивается только при наличии несущественной асимметрии эмпирического распределения (т.е. в данном случае его можно оценить).

   В нашем распределении случае коэффициент куртозиса равен Kurtosis = -0,430181, стандартизованная ошибка куртозиса равна Std.err.=0,528675.

   Стандартизованный куртозис равен 0,8, что меньше 3, значит в нашем случае куртозис несущественен и сформирован под влиянием случайных факторов.

    В исследуемом случае коэффициент  куртозиса является отрицательным  т.е., происходит выпад вершины распределения относительно кривой нормального распределения вверх.

 

Заключение 
 

     В процессе работы исследована совокупность регионов России по признаку «Число женщин на 1000 мужчин» в 2009 году. Совокупность была разбита на 6 групп (интервалов) и найдены различные статистические показатели (центра распределения, структуры распределения, вариации, формы распределения) как для дискретной последовательности, так и для интервального вариационного ряда.

     С помощью ППП STATISTICA, построены полигон, кумулята и гистограмма, в центре которых среднее арифметическое и медиана.

     При проведении данной работы, мы доказали, что гипотеза об «Отношении числа женщин на 1000 мужчин» в 2009 году соответствует  нормальному  распределению и не противоречит статистическим данным.

 

Список  литературы

1. Регионы России. Социально-экономические показатели. Статистический сборник. Федеральная служба государственной статистики (Росстат) 2010.

2. Н.В. Куприенко, О.А. Пономарева, Д.В. Тихонов. Статистика. Анализ эмпирических распределений. Методические указания, Санкт-Петербург Издательство Политехнического Университета, 2011.

3. Пономарева О. А. Конспект лекций по дисциплине «Статистика». Санкт-Петербургский Государственный Политехнический Университет. 
 

Информация о работе Статистический анализ распределения регионов России по соотношению мужчин и женщин (на 1000 мужчин приходится женщин) в 2009 году