Автор работы: Пользователь скрыл имя, 29 Марта 2011 в 19:00, курсовая работа
Цель данной курсовой работы - статистическое изучение предоставления услуг связи населению в регионах России в 2008 году и влияние их на доход от услуг связи населению в расчете на одного жителя.
Введение………………………………………………………………………..…3
Глава 1. Теоретические аспекты кластерного анализа. Метод k-средних.4
Глава 2. Кластерный анализ регионов России.....................…………….…..7
2.1. Евклидова Метрика…...………………………………………………….......9
2.2. Метод k-средних.............................................................................................11
Глава 3. Регрессионный анализ в кластерах……....……………………….16
Глава 4. Дискриминантный анализ………....……………………………….29
Заключение……………………………………………………………………...35
Список литературы.......………………………………………………………..37
Приложения……………………………………………………………………..38
Табл. 3.7. Группа регионов 1.
Где:
X1 – доходы от услуг связи населению в расчете на одного жителя (рублей);
Х2 – число квартирных телефонных аппаратов сети общего пользования на 1000 человек населения (на конец года; штук);
Х3 – средства связи (пользовательское оборудование) для оказания услуг передачи данных и телематических служб на 1000 человек (на конец года;штук);
Х4 – число абонентских терминалов сотовой связи на 1000 человек населения (на конец года; штук);
Х5 – среднедушевые доходы населения (рублей).
Далее приведена корреляционная матрица для данных показателей (Табл. 3.8.):
Табл. 3.8.
X1 | X2 | X3 | X4 | X5 | |
X1 | 1 | 0,215458 | 0,235416 | -0,48011 | 0,068809 |
X2 | 0,215458 | 1 | -0,11719 | -0,40711 | -0,46561 |
X3 | 0,235416 | -0,11719 | 1 | 0,017502 | 0,387714 |
X4 | -0,48011 | -0,40711 | 0,017502 | 1 | 0,07353 |
X5 | 0,068809 | -0,46561 | 0,387714 | 0,07353 | 1 |
Табл. 3.8. Корреляционная матрица для группы 1.
В качестве результативного
признака для регрессионного анализа
опять возьмём показатель X1 (доходы
от услуг связи населению в расчете на
одного жителя), факторными же признаками
будут являться все остальные признаки.
Все результаты представлены таблице
(Рис. 3.4).
Рис. 3.4.
Рис.3.4. Результаты регрессионного анализа для группы 1.
Исходя из таблицы (Рис. 3.4) можно построить следующее уравнение регрессии:
X1=-0,524845-0,377390*X4
Необходимо проверить значимость уравнения регрессии. Для этого находим наблюдаемое значение статистики F. И получаем, что F=4,7929. Теперь найдем критическое значение статистики F на уровне значимости 0,1, оно равно 3,136. Так как наблюдаемое значение статистики F превосходит его критическое, то на уровне значимости 0,1 можно утверждать, что полученное уравнение регрессии значимое.
Далее необходимо проверить значимость коэффициентов уравнения. С вероятностью 0,1 можно утверждать, что коэффициент при X4 значим. Коэффициент детерминации составил 23,1%. Следовательно, на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. А значит данная регрессионная модель имеет низкое практическое значение.
Увеличение числа абонентских терминалов сотовой связи в рассматриваемых регионах страны на единицу ведет к уменьшению дохода от услуг связи населению на одного жителя на 0,3774 единиц в этих регионах.
Что
же касательно общего уравнения регрессии
по всей совокупности данных то оно будет
выглядеть так (рис. 3.5):
Рис. 3.5
Рис. 3.5 Результаты регрессионного анализа для всей совокупности регионов.
X1=0,686084*X5
Необходимо проверить значимость уравнения регрессии. Для этого находим наблюдаемое значение статистики F. И получаем, что F=52,470. Так как наблюдаемое значение статистики F превосходит его критическое, то на уровне значимости 0,1 можно утверждать, что полученное уравнение регрессии значимое.
Далее необходимо проверить значимость коэффициентов уравнения. С вероятностью 0,1 можно утверждать, что коэффициент при X5 значим. Коэффициент детерминации составил 47,1%. Следовательно, на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. А значит данная регрессионная модель имеет низкое практическое значение.
Мы провели регрессионный анализ в каждом из кластеров, которые были получены в ходе кластерного анализа. В каждой из групп влияние на доход от услуг связи населению. Далее представлена сводная таблица (табл. 3.9).
Табл.3.9.
Кластеры | Уравнение регрессии | R^2 | Fнабл |
1 | X1=-0,5248-0,3774*X4 | 23,1 % | 4,7929 |
2 | X1=0,1144+0,3002*X4+0,8074*X5 | 58,8 % | 8,5576 |
3 | X1=0,1155-0,4086*X2 | 24,1 % | 5,3965 |
4 | X1=1,7055-0,6151*X2+0,5564*X5 | 79,1 % | 7,5856 |
Табл. 3.9. Сводная таблица регрессионного анализа по кластерам.
Далее рассчитаем коэффициенты эластичности для каждого показатели в каждом кластере. Коэффициент эластичности рассчитывается по следующей формуле:
Коэффициент эластичности показывает влияние каждого из факторов регрессионный модели на зависимый признак.
Ниже представлена сводная таблица, в которой рассчитаны коэффициенты эластичности по каждому из кластеров (табл. 3.10). Расчет коэффициентов эластичности представлен в таблицах расчета коэффициента эластичности по кластерам Приложения 6.
Табл. 3.10
X2 | X3 | X4 | X5 | ||
1 | - | - | -0,03916 | - | |
2 | - | - |
|
0,05484 | |
3 | -0,05004 | - | - | - | |
4 | -0,05971 | - | 0,004338 | - |
Табл. 3.10. Сводная таблица коэффициентов эластичности.
Проанализировав таблицу 3.10 можно сделать следующие выводы. Влияние факторов на доход от услуг связи населению, перечисленных в данных регрессионных моделях, невелик. Причем, число квартирных телефонных аппаратов влияет на результативный признак только в кластерах 3 и 4, то есть в регионах, где среднедушевой доход населения либо самый большой, либо усреднен. Как видно из сводной таблицы показатель средства связи (пользовательское оборудование) для оказания услуг передачи данных и телематических служб на 1000 человек( на конец года; штук) вовсе не влияет на исследуемый признак. Это обусловлено тем, что данная услуга связи устаревает и потеряла свою популярность в современном. Среднедушевой доход влияет на исследуемый признак только лишь во втором кластере, где сосредоточены регионы с его низким уровнем. Зато, число зарегистрированных абонентских терминалов сотовой связи влияет на доход от услуг связи населению в трёх кластерах: в первом, втором и четвертом. Причем, в первом кластере это единственный показатель, который влияет на результативный признак. Данная тенденция вызвана тем, что в современном обществе очень большую роль играет мобильная связь.
Глава
4. Дискриминантный анализ.
Дискриминантный анализ является разделом многомерного статистического анализа, который позволяет изучать различия между двумя и более группами объектов по нескольким переменным одновременно. Дискриминантный анализ – это общий термин, относящийся к нескольким тесно связанным статистическим процедурам. Эти процедуры можно разделить на методы интерпретации межгрупповых различий – дискриминации и методы классификации наблюдений по группам.3
Цель
дискриминантного анализа состоит
в том, чтобы на основе некоторой
«зависимой переменной» определить
линейные классификационные модели,
позволяющие «предсказать»
Рис 4.1. Исходные данные.
Проведем дискриминантный анализ на основе рейтинга регионов России по обеспеченности населения услугами связи и среднедушевому доходу. Исходный массив данных составляет 61 регион России (исходные данные приведены на рис. 4.1), обследованных по следующим пяти признакам:
X1 – доходы от услуг связи населению в расчете на одного жителя (рублей);
Х2 – число квартирных телефонных аппаратов сети общего пользования на 1000 человек населения (на конец года; штук);
Х3 – средства связи (пользовательское оборудование) для оказания услуг передачи данных и телематических служб на 1000 человек (на конец года;штук);
Х4 – число абонентских терминалов сотовой связи на 1000 человек населения (на конец года; штук);
Х5 – среднедушевые доходы населения (рублей).
Данные показатели в ходе анализа будут являться дискриминантными.
После проведенного кластерного анализа было выделено 4 группы регионов России:
При этом к первому классу отнесено 18 регионов России, ко второму – 15 регионов, к третьему 19 регионов и к четвертому классу было отнесено 7 регионов России.
В качестве проверки корректности обучающих выборок посмотрим результаты классификационной матрицы (табл. 4.1).
Табл. 4.1.
|
Информация о работе Классификация регионов РФ по доходам от услуг связи