Классификация регионов РФ по доходам от услуг связи

Автор работы: Пользователь скрыл имя, 29 Марта 2011 в 19:00, курсовая работа

Описание работы

Цель данной курсовой работы - статистическое изучение предоставления услуг связи населению в регионах России в 2008 году и влияние их на доход от услуг связи населению в расчете на одного жителя.

Содержание работы

Введение………………………………………………………………………..…3

Глава 1. Теоретические аспекты кластерного анализа. Метод k-средних.4

Глава 2. Кластерный анализ регионов России.....................…………….…..7

2.1. Евклидова Метрика…...………………………………………………….......9

2.2. Метод k-средних.............................................................................................11

Глава 3. Регрессионный анализ в кластерах……....……………………….16

Глава 4. Дискриминантный анализ………....……………………………….29

Заключение……………………………………………………………………...35

Список литературы.......………………………………………………………..37

Приложения……………………………………………………………………..38

Файлы: 1 файл

анализ курсовая.docx

— 1.60 Мб (Скачать файл)

Табл. 4.1. Классификационная матрица.

      Как можно заметить из классификационной  матрицы почти все объекты  были распределены верно по кластерам, но как видно из рис. 4.2. не все объекты попали в в верную группу. Ошибочно распределенные объекты помечены знаком «*».

Рис 4.2.

Рис 4.1. Классификация случаев.

      На  рисунке классификации случаев (рис 4.2) некорректно отнесённым объектом оказался регион под номером 42. Это Самарская область. Изначально, она была отнесена к самой оснащённой услугами связи группе регионов.

     Таким образом, задача получения корректных обучающих выборок состоит в  том, чтобы исключить из обучающих  выборок те объекты, которые по своим  показателям не соответствуют большинству  объектов, образующих однородную группу.

       Для этого с помощью метрики Махаланобиса определятся расстояние от всех n объектов до центра тяжести каждой группы (вектор средних), определяемых по обучающей выборке. Отнесение экспертом i-го объекта в j-ю группу считается ошибочным, если расстояние Махаланобиса от объекта до центра его группы значительно выше, чем от него до центра других групп, а апостериорная вероятность попадания в свою группу ниже критического значения. В этом случае объект считается некорректно отнесенным и должен быть исключен из выборки.4

       Процедура исключения объекта из обучающих  выборок состоит в том, что  в таблице исходных данных (рис 4.1) у объекта, который должен быть исключен из выборки (он помечен "*"), убирается номер принадлежности к этой группе, после чего процесс тестирования повторяется.

       В результате дальнейшего анализа, получаем следующие таблицы (табл 4.2.; рис 4.3). Из Табл. 4.2. видно, что дискриминантный анализ выполняется корректно. Такие выводы, я делаю исходя их того факта, что лямбда Уилкса стремится к нулю, а также F-критерий значим. 
 
 
 

       Табл 4.2

Discriminant Function Analysis Summary (Spreadsheet15.sta)  
No. of vars in model: 5; Grouping: обеспеченность услугами связи (4 grps)
Wilks' Lambda: ,08337 approx. F (15,143)=14,007 p<0,0000  
  Wilks' Partial F-remove p-level Toler. 1-Toler.
  Lambda Lambda       (R-Sqr.)
X1 0,125544 0,664058 8,76882 0,000084 0,845137 0,154863
X2 0,138232 0,603108 11,40667 0,000007 0,908463 0,091537
X3 0,113222 0,736330 6,20683 0,001100 0,938229 0,061771
X4 0,157078 0,530746 15,32512 0,000000 0,975267 0,024733
X5 0,093371 0,892876 2,07960 0,114184 0,879408 0,120592
             

Табл 4.2. Результат  дискриминационного анализа.

Рис. 4.3.

       

Рис. 4.3. Классификация  случаев. (после корректировки исходных данных)

     Для того, чтобы определить, к какой  же в итоге группе отнести оставшиёся регион, воспользуемся классификационными функциями (Рис. 4.4.): 
 
 
 

     Рис. 4.4

     

Рис. 4.4. Классификационные  функции.

       Низкая  обеспеченность услугами связи (2):

Y=-4,6266-1,99176*X1-2,46057*X2-1,33796*X3-0,96914*X4-1,22773*X5

       Средняя обеспеченность услугами связи (1):

Y=-1,83011-0,36842*X1+0,53239*X2-0,64585*X3-1,18771*X4-0,14687*X5

      Высокая обеспеченность услугами связи (3):

Y=-2,15695-0,0259*X1+0,15373*X2-0,50246*X3+1,94243*X4+0,09723*X5

       Самая высокая обеспеченность услугами связи (4):

Y=-9,72775+4,42530*X1+2,85678*X2+2,06431*X3-0,42232*X4+2,13654*X5

       Подставив, соответствующие значения в эти  функции получим, что Самарская  область изначально была определена у нас в группу с самым высокой  степенью обеспеченностью услугами связи и среднедушевым доходом, тогда как анализ классификационных  функций показал, что на самом  деле по рассматриваемым показателям  ее следует отнести к субъектам  РФ с высоким уровнем обеспеченности услугами связи и среднедушевым  доходом.

     Наши  выводы подтверждают таблицы (Приложение 6). Расстояния квадратов Махаланобиса и Апостериорные вероятности классификации.

     Расстояние Махалонобиса у рассматриваемого субъекта до третьей группы действительно минимально, а апостериорная вероятность принадлежности объекта к второй группе максимальна. 

 

Заключение.

       Влияние таких факторов, как число квартирных телефонных аппаратов на 1000 человек, число абонентских терминалов сотовой  связи, средства связи для оказания услуг передачи данных и телематических служб на 1000 человек в совокупности со среднедушевым доходом населения оказывают различное влияние на доход от услуг связи населению в различных группах регионов России.

       Так же было замечено, что в тех регионах, где среднедушевой доход выше, увеличивается и степень обеспеченности населения услугами связи. В особенности  средствами мобильной связи.

       C помощью методов кластерного и дискриминантного анализа регионы России были разбиты на четыре кластера: с очень высокой степенью обеспеченности услугами связи, с высокой степенью обеспеченности услугами связи, со средней и соответственно низкой степенями обеспеченности услугами связи.  

 

Список  литературы:

  1. Кошелева В.А.«Анализ методов автоматического извлечения знаний из реляционных баз данных»
  2. Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы и основы эконометрики. / Учебное пособие./ Московский государственный университет экономики, статистики и информатики. М.: МЭСИ, 2002г.
  3. Буреева Н.Н. Многомерный статистический анализ с использованием ППП “STATISTICA”. Учебно-методический материал по программе повышения квалификации «Применение программных средств в научных исследованиях и преподавании математики и механики». Нижний Новгород, 2007
  4. www.gks.ru

 

Приложение 1.

Табл. 1. Исходные данные.

  X1 X2 X3 X4 X5
Белгородская  область 2450,5 396,1 95,6 1211,9 12758
Брянская  область 2675,1 356,1 63,8 1103,6 10043
Владимирская  область 3082,7 346,1 90,4 1343,2 9596
Воронежская область 3536,3 556,1 408,1 983,1 10305
Ивановская  область 2688,3 328 32,4 1400,9 8354
Калужская область 3784,4 424 85,2 1420,4 11756
Костромская область 3061,2 436,5 34,9 1392 9413
Курская область 2781,4 307,1 45,8 1217,5 11411
Липецкая  область 3270 464,2 68,5 1106,5 12274
Орловская область 2661 390,5 47,7 1186 9815
Рязанская область 2960,3 366,4 70,2 1400,5 11311
Смоленская  область 3489,6 484 47,8 1532,2 11523
Тамбовская  область 2530,3 428 58,9 1209,6 11253
Тверская  область 4991,7 353,4 51,4 1483,4 10856
Тульская  область 3150,4 414,7 104,1 1237,3 11389
Ярославская область 3408,7 445 111,2 1448 12587
Республика  Карелия 2667,1 463,4 73,4 1462,1 12229
Республика  Коми 4276,3 516,1 86,5 1495,4 18636
Архангельская область 2784,6 428,5 82,2 1476,2 14824
Вологодская область 2000,9 402,5 76,5 1523,1 12194
Калининградская область 4252 340,1 66 1581,2 12922
Мурманская  область 3315,4 451,7 91,4 1790,1 18773
Новгородская  область 2495,5 456,9 66,2 1546,6 11646
Псковская область 2557,5 434,9 29,8 1404,7 10291
Республика  Адыгея 1258,8 304,2 26,1 707,4 7986
Кабардино-Балкарская Республика 2561,9 301 27,8 956,7 8589
Республика  Калмыкия 1769,8 360,8 6,3 1255 5651
Карачаево-Черкесская Республика 2661,4 323,6 13,1 1203,1 8676
Республика  Северная Осетия - Алания 3786,9 427,7 27,6 1027,6 9838
Астраханская  область 3642 387,8 100,7 1490,1 11120
Волгоградская область 2744,6 385,4 424,3 1296,8 10866
Ростовская  область 3306 356,6 247,2 1100,2 12161
Республика  Башкортостан 3035,1 403,5 341,2 1283 14253
Республика  Марий Эл 2304,6 361,4 33,8 1313,5 7843
Республика  Мордовия 2862,5 482,8 47,8 1287,7 8384
Удмуртская  Республика 2681,3 378 165,7 1161 9581
Чувашская Республика 2142,8 358,6 80,4 1299,8 8594
Пермский  край 3298,9 394,6 172,1 1335,2 16119
Кировская область 2763,6 395,7 64,8 1152,5 10112
Оренбургская  область 2283,8 416,9 118,8 1215,5 10184
Пензенская  область 2991,7 398,8 89,7 1267,6 10173
Самарская область 4097,9 424,4 250,6 1570,3 15805
Саратовская область 3170,8 416,3 186,5 1317,1 9062
Ульяновская область 3777,9 409,1 64,8 1361,4 9756
Курганская  область 2623,6 397,1 55,7 1180,6 11161
Челябинская область 3278,9 369,7 258,8 1522,1 14161
Республика  Алтай 1488,7 346,9 20,7 1006,2 10173
Республика  Бурятия 2805,5 323,6 35 1244 11299
Республика  Хакасия 3986,4 331,8 97,7 1408,6 10764
Алтайский край 2882,4 447,9 289,2 1125,1 9749
Забайкальский край 3553,4 272,5 25,5 1018,9 10972
Красноярский  край 4186,1 376,6 466,4 1385,9 15605
Иркутская область 3591,5 299,9 105 1505,7 12882
Кемеровская область 3249,6 308,8 439,9 1235 14439
Новосибирская область  4921,5 448,1 729,9 1337,9 12838
Томская область 4172,6 538,6 222,6 1232,2 13482
Республика  Саха (Якутия) 5396,1 454,2 61,4 957,2 18741
Камчатский  край 6735 531,2 43,5 1421,1 19063
Приморский  край 5236,5 407,5 258 1531 12808
Хабаровский край 5334,7 393,6 137,8 1315,6 15705
Амурская  область 3809,1 290,6 49,9 1295,9 11936
Сахалинская область 7182,2 459,7 29,8 1329,9 24552
 
 
 
 
 
 
 
 
 
 

Приложение 2

Рис 1. График распределения показателей по регионам X1 и X2.

Рис 2. График распределения показателей по регионам X1 и X3. 

Рис 3. График распределения показателей по регионам X1 и X2. 

Приложение 3

Табл. 1 Стандартизированный  данные

  X1 X2 X3 X4 X5
Белгородская  область -0,813135 0,004700974 -0,23073167 -0,45344367 0,29237491
Брянская  область -0,591355 -0,65074913 -0,46275516 -1,02263269 -0,57138775
Владимирская  область -0,188871 -0,81461165 -0,26867262 0,236625756 -0,71359839
Воронежская область 0,2590349 2,626501386 2,04937333 -1,65594088 -0,48803385
Ивановская  область -0,57832 -1,11120283 -0,69186011 0,539877894 -1,10873402
Калужская область 0,5040206 0,461877421 -0,30661357 0,642363452 -0,026406
Костромская область -0,210101 0,666705578 -0,67361927 0,493102435 -0,77181886
Курская область -0,486389 -1,4536755 -0,59408921 -0,42401192 -0,1361659
Липецкая  область -0,003922 1,120604774 -0,42846238 -1,00739125 0,13839291
Орловская область -0,605278 -0,08706204 -0,58022617 -0,58956551 -0,64392472
Рязанская область -0,309735 -0,48197073 -0,41605861 0,537775627 -0,16798036
Смоленская  область 0,2129211 1,445052575 -0,57949654 1,229947319 -0,1005337
Тамбовская  область -0,734337 0,527422431 -0,49850721 -0,46553171 -0,18643275
Тверская  область 1,6961655 -0,69499201 -0,55322973 0,97347064 -0,31273617
Тульская  область -0,122021 0,309485272 -0,16871282 -0,31994966 -0,14316508
Ярославская область 0,1330367 0,805988725 -0,11690883 0,787419935 0,23797218
Республика  Карелия -0,599254 1,107495772 -0,39271033 0,861524877 0,1240764
Республика  Коми 0,9897458 1,971051283 -0,29712833 1,036538676 2,16242901
Архангельская область -0,483229 0,535615557 -0,32850258 0,935629819 0,9496617
Вологодская область -1,257091 0,109572991 -0,37009169 1,182120725 0,11294134
Калининградская область 0,9657509 -0,91292917 -0,44670322 1,487475131 0,34455063
Мурманская  область 0,0409078 0,915776617 -0,26137629 2,58538452 2,20601482
Новгородская  область -0,7687 1,00098513 -0,44524395 1,305628962 -0,06140191
Псковская область -0,707478 0,640487574 -0,71083058 0,559849439 -0,49248788
Республика  Адыгея -1,989876 -1,50119564 -0,73782703 -3,104929 -1,22581124
Кабардино-Балкарская Республика -0,703134 -1,55363165 -0,72542326 -1,79469056 -1,03397003
Республика  Калмыкия -1,485291 -0,57373374 -0,88229448 -0,22692431 -1,96867894
Карачаево-Черкесская Республика -0,604883 -1,18330234 -0,8326794 -0,49969356 -1,00629145
Республика  Северная Осетия - Алания 0,5064892 0,522506555 -0,72688252 -1,42206358 -0,63660739
Астраханская  область 0,3634081 -0,13130492 -0,19352036 1,008683627 -0,22874598
Волгоградская область -0,522727 -0,17063193 2,16757397 -0,00723732 -0,30955472
Ростовская  область 0,0316258 -0,642556 0,87539286 -1,04050197 0,10244257
Республика  Башкортостан -0,235874 0,125959243 1,56124845 -0,07976556 0,76800112
Республика  Марий Эл -0,957204 -0,56390199 -0,68164524 0,080532367 -1,27130592
Республика  Мордовия -0,406307 1,425389072 -0,57949654 -0,05506391 -1,09918968
Удмуртская  Республика -0,585232 -0,2918902 0,28074148 -0,72095725 -0,71837056
Чувашская Республика -1,116973 -0,6097835 -0,34163598 0,008529693 -1,03237931
Пермский  край 0,024615 -0,0198784 0,32743803 0,194580399 1,36165899
Кировская область -0,503966 -0,00185353 -0,45545882 -0,76563045 -0,54943577
Оренбургская  область -0,977743 0,345535028 -0,06145668 -0,43452326 -0,52652935
Пензенская  область -0,278729 0,048943856 -0,27378006 -0,16070287 -0,53002894
Самарская область 0,8135852 0,468431922 0,90020041 1,430188332 1,26176158
Саратовская область -0,101877 0,335703276 0,43250527 0,099452778 -0,88348762
Ульяновская область 0,4976022 0,217722258 -0,45545882 0,332278943 -0,66269525
Курганская  область -0,642208 0,021087227 -0,52185548 -0,61794613 -0,21570206
Челябинская область 0,004866 -0,42789609 0,96003036 1,176865055 0,73873182
Республика  Алтай -1,762862 -0,80150265 -0,77722724 -1,53453491 -0,53002894
Республика  Бурятия -0,462591 -1,18330234 -0,67288964 -0,28473667 -0,1717981
Республика  Хакасия 0,7034849 -1,04893507 -0,21540937 0,580346551 -0,34200547
Алтайский край -0,386657 0,853508857 1,18183898 -0,90963579 -0,66492226
Забайкальский край 0,2759203 -2,02063984 -0,74220483 -1,46778791 -0,27583139
Красноярский  край 0,9006781 -0,31483095 2,47474972 0,46104285 1,19813266
Иркутская область 0,313542 -1,57165652 -0,16214612 1,090672073 0,33182484
Кемеровская область -0,024066 -1,42581888 2,28139681 -0,3320377 0,82717602
Новосибирская область  1,6268467 0,856786108 4,39733426 0,208770707 0,31782648
Томская область 0,8873476 2,339741966 0,695903 -0,34675357 0,52271162
Республика  Саха (Якутия) 2,0954892 0,956742249 -0,48026637 -1,79206273 2,1958342
Приморский  край 1,9378926 0,191504253 0,95419329 1,223640515 0,30828214
Хабаровский край 2,0348599 -0,03626466 0,0771737 0,091569274 1,22994712
Амурская  область 0,5284105 -1,72404867 -0,56417423 -0,01196742 0,03086003
Сахалинская область 3,8591686 1,046866638 -0,71083058 0,16672535 4,04457261
 
 
 
 
 
 
 
 
 

Приложение 4.

Рис 1. Евклидова  метрика. Метод ближнего соседа.

Рис 1. Евклидова  метрика. Метод дальнего соседа. 
 
 
 

Приложение 5

                        Табл. 1 Члены кластера №1 с соответствующими расстояниями.

                        Табл. 2 Члены кластера №2 с соответствующими расстояниями

 
 
 
 

Табл. 3 Члены  кластера № 3 с соответствующими расстояниями.

            

Табл. 4 Члены  кластера №4 с соответствующими расстояниями.

 

Приложение 6

1 кластер:

X1=-0,5248-0,3774*X4

Табл 1.

  Y(X1 расчитанное) X2 X3 X4 X5
Белгородская  область -0,3537 0,004701 -0,23073 -0,45344 0,292375
Воронежская область  0,1002 2,626501 2,049373 -1,65594 -0,48803
Липецкая  область    -0,1446 1,120605 -0,42846 -1,00739 0,138393
Тамбовская  область  -0,3491 0,527422 -0,49851 -0,46553 -0,18643
Тульская  область    -0,4041 0,309485 -0,16871 -0,31995 -0,14317
Республика  Северная Осетия - Алания                           0,0119 0,522507 -0,72688 -1,42206 -0,63661
Волгоградская область                           -0,5221 -0,17063 2,167574 -0,00724 -0,30955
Ростовская  область  -0,1321 -0,64256 0,875393 -1,0405 0,102443
Республика  Башкортостан                           -0,4947 0,125959 1,561248 -0,07977 0,768001
Республика  Мордовия -0,5040 1,425389 -0,5795 -0,05506 -1,09919
Удмуртская  Республика                           -0,2527 -0,29189 0,280741 -0,72096 -0,71837
Кировская область   -0,2359 -0,00185 -0,45546 -0,76563 -0,54944
Оренбургская  область -0,3608 0,345535 -0,06146 -0,43452 -0,52653
Пензенская  область  -0,4642 0,048944 -0,27378 -0,1607 -0,53003
Саратовская область  -0,5623 0,335703 0,432505 0,099453 -0,88349
Курганская  область  -0,2916 0,021087 -0,52186 -0,61795 -0,2157
Алтайский край      -0,1815 0,853509 1,181839 -0,90964 -0,66492
Кемеровская область  -0,3995 -1,42582 2,281397 -0,33204 0,827176
сумма Y=-5,5407     -10,3489  
        -0,57494  
      Э4= -0,03916  

Информация о работе Классификация регионов РФ по доходам от услуг связи