Автор работы: Пользователь скрыл имя, 28 Сентября 2011 в 13:48, реферат
Корреляция — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Математической мерой корреляции двух случайных величин служит коэффициент корреляции.
Введение………..…………………………………………………………………3
1. Автокорреляция уровней………………………………………………………....4
2. Автокорреляционная функция………………………………………...…………6
3. Методы автокорреляции………………………………………………………..9
3.1 Метод скользящего окна………………………………………………...9
3.2 Метод аналитического выравнивания…………………………….......10
4. Модели с распределенным лагом……………………………………………….12
5. Изменения тенденции временного ряда……………………………………..…14
6. Проверка остаточных величин на автокорреляцию…………………...………16
7. Способы исключения автокорреляции ………………………………………...18
Заключение……………………………………………………...………………..19
Список использованной литературы…………………………………………...21
1) выравнивание исходного
ряда методом скользящей
2) расчет сезонной компоненты;
3) устранение сезонной
компоненты из исходных
4) аналитическое выравнивание уровней и расчет значений тренда с использованием полученного уравнения тренда;
5) расчет полученных
по модели значений, генерируемых
трендом и сезонной
6) расчет абсолютных и относительных ошибок.
В качестве основной тенденции выдвигается гипотеза о некоторой аналитической функции, выражающей данную зависимость. Но ведь требуется еще определить коэффициенты (параметры) данной зависимости. Для определения (оценивания) параметров тренда используется обычный МНК. Критерием отбора наилучшей формы тренда является наибольшее значение скорректированного коэффициента детерминации.
Для устранения тренда применяют метод отклонений от тренда, в ходе которого вычисляются значения тренда для каждого ряда динамики модели и отклонения от тренда. Для последующего анализа уже применяют не исходные данные, а отклонения от тренда.
Другой способ устранения тренда — это метод последовательных разностей. Если тренд линейный, то исходные данные заменяются первыми разностями, которые в этом случае равны просто коэффициенту регрессии b, сложенному с разностью соответствующих случайных компонент. Если тренд параболический, то исходные данные заменяются вторыми разностями. В случае экспоненциального и степенного тренда метод последовательных разностей применяется к логарифмам исходных данных. Не следует упускать из виду и уже обсуждавшуюся выше автокорреляцию в остатках. Для выявления автокорреляции остатков используется критерий Дарбина — Уотсона.
Критерий Дарбина-Уотсона представляет собой распространенную статистику, предназначенную для тестирования наличия автокорреляции остатков первого порядка после сглаживания ряда или в регрессионных моделях.
Численное значение коэффициента равно
d = [(e(2)-e(1))2 + ... + (e(n)-e(n -1))2]/[e(1)2 + ... + e(n)2],
где e(t) - остатки.
Возможные значения критерия находятся в интервале от 0 до 4, причем табулированы его табличные пороговые значения для разных уровней значимости (Лизер, 1971).
Значение
d близко к величине 2*(1 - r1),
где r - выборочный коэффициент
автокорреляции для остатков. Соответственно,
идеальное значение статистики - 2 (автокорреляция
отсутствует). Меньшие значения соответствуют
положительной автокорреляции остатков,
большие - отрицательной.
4. Модели с распределенным лагом
Рассматриваются также и эконометрические модели, содержащие не только текущие, но и лаговые (учитывающие запаздывание) значения факторных переменных. Эти модели так и называются моделями с распределенным лагом. Если максимальная величина лага конечна, то для такой модели зависимость имеет довольно простой вид. Это просто сумма свободного члена и произведений коэффициентов (регрессии) на факторные переменные (в текущий момент, в предшествующий момент, в предпредшествующий момент и т.д.). Естественно, имеется еще и случайный член. Последовательные суммы соответствующих коэффициентов при значениях факторов в различные моменты времени называются промежуточными мультипликаторами. Для максимального лага воздействие фактора на результативное переменное описывается полной суммой соответствующих коэффициентов, которая и называется долгосрочным мультипликатором. После деления этих коэффициентов на долгосрочный мультипликатор получаются относительные коэффициенты модели с распределенным лагом. По формуле средней арифметической взвешенной получают величину среднего лага модели множественной регрессии. Эта величина представляет собой средний период, в течение которого будет происходить изменение результата под воздействием изменения фактора в момент t. Имеется также медианный лаг — период, в течение которого с момента времени t будет реализована 1/2 общего воздействия фактора на результат.
Во многих практически интересных ситуациях выявление тренда (при всей важности этого) вовсе не является завершением исследования структуры ряда и требуется по крайней мере обнаружение и изучение еще циклической (сезонной) составляющей. Проще всего для решения подобных задач использовать метод скользящей средней, далее построить аддитивную или мультипликативную модель временного ряда. Если амплитуда сезонных колебаний (или циклических колебаний) приблизительно постоянна, то строят аддитивную модель временного ряда, в котором значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, то строят мультипликативную модель. В мультипликативной модели уровни ряда зависят от значений сезонной компоненты.
В остальном схема во многом аналогична приведенной выше с очевидными модификациями. Именно процесс построения модели включает следующие шаги:
1) выравнивание исходного
ряда методом скользящей
2) расчет значений сезонной компоненты;
3) устранение сезонной
компоненты из исходных
После этого наступает очередь шагов второго уровня:
4) получение выровненных
данных в аддитивной или
5) аналитическое
выравнивание этих, один раз уже
выровненных уровней
6) расчет уже по
этой модели значений
Если полученные значения ошибок не содержат автокорреляции, то ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок для анализа взаимосвязи исходного ряда и других временных рядов.
Иногда строится модель регрессии с включением (явно) фактора времени и фиктивных переменных. При этом количество фиктивных переменных должно быть на единицу меньше числа моментов (периодов) времени внутри одного цикла колебаний. Каждая фиктивная переменная отражает сезонную (циклическую) компоненту ряда для какого-либо одного периода, поэтому она просто численно равна единице для данного периода и нулю для всех остальных периодов. Основным недостатком модели с фиктивными переменными является большое количество фиктивных переменных во многих случаях и тем самым снижение числа степеней свободы. В свою очередь, уменьшение числа степеней свободы снижает вероятность получения статистически значимых оценок параметров уравнения регрессии.
Кроме сезонных и циклических колебаний весьма важную роль играют единовременные изменения характера тенденции временного ряда. Эти (относительно) быстрые однократные изменения тренда (его характера) вызываются структурными изменениями в экономике либо мощными глобальными (внешними) факторами. Прежде всего выясняется, значимо ли повлияли общие структурные изменения на характер тренда. При условии значимости такого влияния (структурных изменений) на характер тренда используется кусочно-линейная модель регрессии. Кусочно-линейная модель означает представление исходной совокупности данных ряда в виде двух частей. Одна часть данных моделируется просто линейной моделью с одним коэффициентом регрессии (углом наклона прямой) и представляет данные до момента (периода) структурных изменений. Вторая часть данных — это тоже линейная модель, но уже с иным коэффициентом регрессии (углом наклона).
После
построения двух таких моделей (подмоделей)
линейной регрессии получают уравнения
двух соответствующих прямых. Если
структурные изменения
Если строится кусочно-линейная модель, то снижается остаточная сумма квадратов по сравнению с единым для всей совокупности уравнением тренда. В то же время разделение исходной совокупности на две части ведет к потере числа наблюдений и тем самым к снижению числа степеней свободы в каждом уравнении кусочно-линейной модели. Единое уравнение для всей совокупности данных позволяет сохранить число наблюдений исходной совокупности. Остаточная сумма квадратов по этому уравнению в то же время выше, чем такая же сумма для кусочно-линейной модели. Выбор конкретной — кусочно-линейной или просто линейной — модели, т.е. единого уравнения тренда, зависит от соотношения между снижением остаточной дисперсии и потерей числа степеней свободы при переходе от единого уравнения регрессии к кусочно-линейной модели.
Для оценки этого соотношения был предложен статистический тест Грегори — Чоу. В этом тесте рассчитываются параметры уравнений трендов, вводится гипотеза о структурной стабильности тенденции исследуемого ряда динамики. Ясно, что остаточную сумму квадратов кусочно-линейной модели можно найти как сумму соответствующих сумм квадратов для обеих линейных компонент модели. Сумма числа степеней свободы этих компонент дает число степеней свободы всей модели в целом. Тогда сокращение остаточной дисперсии при переходе от единого уравнения тренда к кусочно-линейной модели — это просто остаточная сумма квадратов, из которой вычтены соответствующие суммы для обеих компонент кусочно-линейной модели. Столь же просто определяется и соответствующее число степеней свободы.
После
этого рассчитывается фактическое
значение F-критерия по дисперсиям
на одну степень свободы. Это значение
сравнивают с табличным, полученным по
таблицам распределения Фишера для требуемого
уровня значимости и соответствующего
числа степеней свободы. Как всегда, если
расчетное (фактическое) значение больше
табличного (критического), то гипотеза
о структурной стабильности (незначимости
структурных изменений) отклоняется. Влияние
же структурных изменений на динамику
изучаемого показателя признается значимым.
Таким образом, следует моделировать тенденцию
ряда динамики с помощью кусочно-линейной
модели. Если же расчетное значение меньше
критического, то нельзя отклонять нуль-гипотезу
без риска сделать неверный вывод. В этом
случае следует использовать единое для
всей совокупности уравнение регрессии
как наиболее достоверное и минимизирующее
вероятность ошибки.
Заключение
При
изучении развития явления во времени
часто возникает необходимость
оценить степень взаимосвязи
в изменениях уровней нескольких
рядов динамики.
Применение методов
классической теории
корреляции (рассмотренных
в предыдущих вопросах
темы) связано с определенными
особенностями:
1) в рядах динамики зачастую наблюдается
зависимость между последующими и предшествующими
уровнями. Наличие такой связи в статистической
литературе называют автокорреляцией.
При изучении взаимосвязи между рядами
динамики с применением методов корреляционно-регрессионного
анализа автокорреляция должна быть исключена
из каждого из сравниваемых рядов динамики;
2) в изменении уровней нескольких рядов
динамики, как правило, существует лаг,
т.е. смещение во времени по сравнению
с изменением уровней другого ряда динамики.
Для получения более правильной оценки
степени тесноты корреляционной связи
также необходимо исключить этот лаг,
т.е. нужно сдвинуть уровни одного ряда
относительно другого на некоторый промежуток
времени;
3) условия формирования уровней рассматриваемых
рядов, как правило, изменяются. Эти изменения
могут быть и существенными. Соответственно
может изменяться во времени и степень
тесноты связи. В этих условиях речь идет
о переменной корреляции.
Таким образом, при анализе корреляционной
связи между рядами динамики необходимо:
1) измерить связь между предыдущими и
последующими уровнями; 2) с учетом указанных
выше особенностей изучить связь между
рядами динамики.
Первая задача решается по каждому ряду
динамики: в качестве факторного признака
рассматриваются фактические уровни ряда,
а уровни этого же ряда со сдвигом на один
период принимаются в качестве результативного
признака. Исчисляются коэффициенты автокорреляции
и авторегрессии. При этом коэффициент
автокорреляции рассчитывается на основе
формулы коэффициента линейной (парной)
корреляции.
Если результаты расчета коэффициентов
автокорреляции будут указывать на наличие
автокорреляции уровней исходных рядов
динамики, то для дальнейшего анализа
корреляционной связи между рядами динамики
нужно исключить эту автокорреляцию.
Имеется несколько способов исключения
автокорреляции. Первый способ состоит
в исключении от фактических уровней тренда
(т.е. «выравненного» ряда). По каждому
показателю времени находится отклонение
фактического уровня от расчетного (сглаженного,
выравненного). Т.е.
коррелируют отклонения.
Как показатель тесноты
связи между изучаемыми
рядами динамики используется
коэффициент корреляции
отклонений.