Эвристические методы периодизации

Автор работы: Пользователь скрыл имя, 27 Сентября 2011 в 02:33, курсовая работа

Описание работы

Целью работы является изучение методологии эвристических методов, реализация их на практике по показателям здоровья России и анализ полученных данных , что достигается с помощью рассмотрения следующих вопросов:

1. Понятие периодизации и ее возможность;

2. Понятие однородности периодов;

3. Методология эвристических методов;

4. Достоинства и недостатки данных методов;

Содержание работы

Введение . 3
1. Понятие периодизации, необходимость и возможность. 4
1.1 Сущность и условия временной периодизации. 4
1.2 Однородность временных рядов. 6
2. Эвристические методы периодизации. 7
2.1 Предварительные процедуры. 7
2.1 Вроцлавская таксономия: дендрит. 10
2.2 Метод шаров. 13
2.3 Метод корреляционных плеяд. 16
3. Периодизация здоровья в Российской Федерации за 1991- 2005 гг. 18
3.1 Предварительные процедуры. 18
3.2 Периодизации здоровья населения в России с помощью метода шаров. 20
3.2 Периодизации здоровья населения в России с помощью метода дендритов. 22
3.3 Периодизации здоровья населения в России с помощью метода корреляционных плеяд. 25
Заключение. 30
Список литературы. 32

Файлы: 1 файл

эвристические методы периодизации.doc

— 785.50 Кб (Скачать файл)

     Свойства  матрицы корреляции:

                    1. =1

                    2. =

                    3. 

     Методы  классификации основанные на матрицах корреляции называются факторными.

     В данном случае чем выше взаимосвязь  между моментами времени по изучаемой  системе показателей тем выше их сходство.

  2.1 Вроцлавская таксономия: дендрит.

 

     Метод вроцлавской таксономии часто называют методом дендритов. Под дендритом  понимают ломаную, которая может  разветвляться, но не может содержать  замкнутых линий, и такая, что  любые две точки множества Z ею соединены.Этим методом получают нелинейное упорядочение изучаемых единиц, что, с одной стороны, полнее характеризует действительность, но, с другой стороны, создает больше трудностей при интерпретации. Нелинейное упорядочение характеризуется отсутствием явной иерархии, выражающимся в том, что некоторые единицы могут быть связаны с большим числом других единиц. В этом случае отсутствует четко определяемый порядок, не известно, какой элемент  является предшествующим, а какой последующим.

      Рассматриваемые случаи упорядочения можно представить графически в  виде точек или кружков(со вписанными в них обозначаемыми единиц), связанных  отрезками. Точки, изображающие единицы, чаще всего называются вершинами, а  отрезки – связями(дугами). Упомянутые  линейный и нелинейный способы упорядочения иллюстрируют рис.1 и рис.2.

         

     Рис.2.1 Линейное упорядочение единиц

     

       
 

     Рис.2.2 Нелинейные упорядочения единиц

     Предоставленные на рисунках упорядочения, очевидно, не исчерпывают все возможные ситуации. В связи с этим возникает задача выбора наилучшего упорядочения, заключающегося в нахождении такого дендрита, в котором смежные единицы будут иметь различающиеся значения признаков. Выполнение этого условия приведет к упорядочению с наименьшими расстояниями между отдельными элементами. В оптимальном дендрите – с наименьшей суммой длин связей – смежные объекты в наименьшей степени отличаются друг от друга. Поэтому при сравнении различных упорядочений объектов и выборе наилучшего упорядочения исходят из длины связей дендрита.

     Построение  оптимального дендрита заключается  в установлении связей между единицами, наименее отличающимися друг от друга. С этой целью из составленной матрицы  расстояний выбирают единицы с близкими значениями признаков. Поиск таких  единиц проводится путем нахождения наименьших чисел в каждом столбце (или строке) матрицы. Искомые ближайшие единицы обозначены  номерами строк(или столбцов), в которых находятся наименьшие числа. Если, например, надо найти единицу, наименее отличающуюся от i, то достаточно отыскать наименьшее число в столбце j. Пусть этим числом будет элемент , находящийся в строке i. Тогда ближайшей к единице iбудет единица j.

     Способ  построения оптимального дендрита состоит  из нескольких этапов. На первом этапе устанавливаются связи каждой из исследуемых единиц с ближайшими единицами.

     Для удобства описания выполняемых операций предположим, что у нас имеется  множество единиц, обозначаемых символами 1,2,3,4,5,6,7,8,9. Далее предположим, что  в этом множестве из девяти элементов получены следующие сочетания ближайших единиц(рис.3).

       
 
 

     Рис.2.3 Сочетание ближайших единиц

     Нетрудно  заметить, что некоторые связи встречаются дважды, например 1-3 и 3-1. Поскольку при построении дендрита очередность установления связей не играет роли, одно из повторяющихся сочетаний всегда исключаются. Подобное исключение проводится для всех выделенных пар связей. Это приводит к тому, что остаются связи 2-7 и 8-9, а связи 7-2 и 9-8 отбрасываются. Для оставшихся двух связей характерно наличие единицы, обозначаемой номером 5, поэтому связи 4-5 и 5-6 объединяют в один общий набор. В результате получаются четыре отдельных конструкций, называемые скоплениями 1-го порядка(рис.4).

       
 

     Рис.2.4 Скопления 1-го порядка.

      Полученные  скопления не удовлетворяют основному условию дендрита, а именно они не связаны в единое целое. Для выполнения этого требования выбирается наименьшее расстояние между единицами, входящими в различные скопления 1-го порядка. Соответствующий отрезок становится связью между двумя скоплениями. В результате получают скопление 2-го порядка. Процесс останавливаем на том шаге, когда все точки множества будут соединены ломаной(рис.5). 
 

     Рис.2.5 Дендрит, построенный на единицах исследуемого множества

     Разбиение оптимального дендрита на группы однородных элементов может осуществляться одним из 2-х способов:

     1)Искусственное  разбиение. Пусть на основании  некоторой априорной информации  нам известно число однородных  грум и пусть это число равно  k. Тогда разбиение осуществляется очень просто: из дендрита удаляются k-1самых длинных связей.

     2)Естественное  разбиение. Что произвести подобное  естественное разбиение, необходимо  выполнить следующие действия. Прежде  всего, связи дендрита, построенного  на единицах изучаемого множества,  упорядочиваются по убыванию их длины. Затем строятся отношения длин соседних связей:

     

,

     Где - упорядоченные длины связей, - отношения длин связей.

     Следующая операция заключается в нахождении значения k, для которого выполняется соотношение, являющееся основанием разбиения множества естественным образом.  Этой цели служит неравенство:

     

  (для k=2,3,…,n-1)

     Может оказаться, что в ряду вычисленных  отношений приведенное неравенство  будет выполнятся  несколько раз. В этом случае вводится дополнительное условие. Оно позволяет выбрать лучшее из двух естественных разбиений и . Это дополнительное условие определяется соотношением . Если оно выполняется, то можно утверждать, что лучшим является разбиение на k частей.

2.2 Метод шаров.

 

     Перед описанием этого метода дадим  геометрическую модель для простейшего  случая двумерного пространства. Единицы  исследуемого множества характеризуются только двумя признаками и изображаются точками на плоскости. Тогда их можно представить как множество точек с координатами ( ) при i=1,…,w, причем w- число элементов множества.

     Для выполнения дальнейших преобразований необходимо знать некоторую величину . Если эта величина известна, то поступают следующим образом. Из каждой точки , как центра, строится круг радиусом . Затем подсчитывается число точек, находящихся внутри каждого круга. Тем самым находится первое подмножество. Элементами его являются элементы круга, содержащего наибольшее число точек. Если есть несколько кругов с одним и тем же числом точек, то первое подмножество образуют точки круга, центр которого расположен ближе всего к началу системы координат.

     Дальнейшее  разбиение производится подобным же образом, но число элементов множества  уменьшается за счет элементов первого  подмножества

     

     

     

     

     

     Рис.2.6 Разбиение множества единиц, характеризуемых двумя признаками.

     На  рис. 2.6 показано расположение пяти точек-единиц. Поскольку эти единицы описываются  только двумя признаками, их можно  поместить на плоскости. После вычерчивания кругов и подсчета числа точек  в них не трудно убедится, что первое подмножество образуют точки- единицы заштрихованного круга.

     Опишем  теперь общий порядок действий, относящихся  к пространству произвольной размерности.

     Пусть дано множество точек с координатами ( ), причем i=1,2,…,w. Для каждой точки строится шар заданного радиуса :

     

.

     Затем подсчитывается  число точек  ,находящихся внутри каждого шара: , где обозначает подмножество i множества . Оно образовано точками , удовлетворяющими условию .

     Если  обозначить через  , объем подмножества , то   - величина, определяющая первое выделяемое подмножество. В случае существования нескольких подмножеств с максимальным объемом исчисляют расстояния центров выбранных шаров от начала системы координат. Первое подмножество образуют единицы, содержащиеся в шаре, ближе всего находящегося от начала системы координат. Это подмножество обозначаем символом .

     Дальнейшие  действия производятся таким же самым  образом , только относятся не ко всем объектам, а лишь к тем, которые остались после исключения первого подмножества. Это значит, что при дальнейшем выделении подмножеств рассматривается множество .

     Описанная процедура, очевидно, продолжается до момента полного исчерпания множества .

     Теперь  осталось выяснить проблему, связанную с оценкой величины . При оценке этой величины рассматривают два случая:

     В первом 

     Во  втором , причем ; , где i,j=1,2,…,w.

     Величина  остается постоянной.

     В результате применения рассмотренного метода получаются подмножества, однородные в смысле изотропности, т.е. подмножества точек-данных, которые расположены в многомерном пространстве так, что по форме облако рассеивания больше похоже на шар чем на эллипсоид.

     С точки зрения потребностей экономического моделирования  подобные подмножества представляют собой результат искусственного , навязанного, а не естественного разбиения исследуемой совокупности объектов. При таком способе разбиения существует потенциальная  возможность разделить  действительно однородные объекты. Подобное  нежелательное разбиение может возникнуть вследствие того, что в значениях признаков присутствуют обе компоненты( структуры и потенциала).

2.3 Метод корреляционных плеяд.

 

     Метод корреляционных плеяд самый первый из эвристических методов классификации  данных и он наименее формализован. Выглядит этот метод очень трудоемким особенно это становится явным при достаточно большом числе объектов.

     Преимущество  этого метода в том что он учитывает  все связи он не отбрасывает как  два предыдущих метода «не нужную информацию». Исторически метод корреляционных плеяд применяется и используется до сих пор к матрицам корреляции. Но в принципе технику этого метода можно применить и получить корректные данные на матрицах расстояний.

     Осуществляется  следующим образом:

     В матрице  коэффициентов корреляции выбирается максимальный  по абсолютной величине коэффициент корреляции( не считая диагональных). Пусть им оказался . Чертим два кружка, соответствующие признакам и , и соединяем их линией, над которой пишем значение . Затем находим наибольший по абсолютной величине коэффициент  в -том столбце матрицы корреляции( он будет соответствовать признаку, наиболее тесно после связанному с ). Выбираем больший из этих двух коэффициентов. Пусть им оказался . Чертим кружок , соединяем его с кружком , над связью пишем . Далее находим признаки, наиболее тесно связанные с двумя последними рассмотренными( в данном случае и ), и повторяя процедуру выбора, выбираем из двух соответствующих коэффициентов корреляции наибольший по абсолютной величине. Продолжая построение, на каждом шаге находим признак, наиболее тесно связанный с одним из двух признаков, отобранных на предыдущем этапе. Построение чертежа завершим, когда в нем окажется m кружков(m - число признаков). Выбираем пороговую величину h и исключаем из схемы связи, соответствующие меньшим чем h коэффициентам парной корреляции. Величину h  выбираем до тех пор, пока не получим нормальных групп(плеяд) признаков(h является порогом, при переходе через который происходит рассеивание групп на отдельные, не связанные признаки).

Информация о работе Эвристические методы периодизации