Применение пакета Statistica при анализе и прогнозе временного ряда

Автор работы: Пользователь скрыл имя, 26 Сентября 2013 в 18:31, лабораторная работа

Описание работы

Цель работы – приобретение практических навыков по анализу и прогнозированию временных рядов в пакете Statistica.
Задача:
Провести по данным примера анализ и прогноз временного ряда в пакете Statistica в модуле Time series analysis & forecasting (Анализ временных рядов и прогнозирование).
В качестве временного ряда рассматривается динамика складских запасов сгущенного молока (см. таблицу ниже). Таблица состоит из ежемесячных складских записей с января 1981 года по декабрь 1990 года.

Файлы: 1 файл

Otchet_5.docx

— 4.19 Мб (Скачать файл)

Министерство образования  и науки Российской Федерации

Федеральное государственное  бюджетное образовательное учреждение высшего профессионального образования

«УФИМСКИЙ ГОСУДАРСТВЕННЫЙ  АВИАЦИОННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»

 

 

 

 

 

Лабораторная работа №5

по дисциплине «Эконометрика»

 

 

Тема

«Применение пакета Statistica

при анализе и прогнозе временного ряда»

 

 

 

 

 

 

Выполнил: студент группы ЭК-209

Аглиуллина И.Р.

Проверил: Кульмухаметов М.Я.

 

 

 

 

 

Уфа 2013

 

Цель работы – приобретение практических навыков по анализу и прогнозированию временных рядов в пакете Statistica.

Задача:

Провести по данным примера  анализ и прогноз временного ряда в пакете Statistica в модуле Time series analysis & forecasting (Анализ временных рядов и прогнозирование).

В качестве временного ряда рассматривается динамика складских  запасов сгущенного молока (см. таблицу ниже). Таблица состоит из ежемесячных складских записей с января 1981 года по декабрь 1990 года.

Дата

Запас

Дата

Запас

Дата

Запас

Дата

Запас

Дата

Запас

Дата

Запас

01.81

158,38

09.82

188,84

05.84

155,04

01.86

89,53

09.87

193,61

05.89

135,32

02.81

93,39

10.82

183,8

06.84

172,38

02.86

94,58

10.87

179,31

06.89

162,06

03.81

91,63

11.82

149,06

07.84

201,47

03.86

102,39

11.87

145,99

07.89

179,69

04.81

75,25

12.82

119,7

08.84

212,56

04.86

121,76

12.87

120,16

08.89

176,67

05.81

127,97

01.83

105,18

09.84

198,54

05.86

149,57

01.88

104,74

09.89

174,25

06.81

157,83

02.83

100,16

10.84

169,08

06.86

170,41

02.88

97,87

10.89

163,77

07.81

186,37

03.83

80,62

11.84

145,97

07.86

188,11

03.88

97,07

11.89

133,44

08.81

196,91

04.83

101,18

12.84

124,17

08.86

181,35

04.88

102,38

12.89

121,79

09.81

187,01

05.83

130,44

01.85

113,13

09.86

180,15

05.88

124,43

01.90

120,28

10.81

175,5

06.83

159,08

02.85

106,77

10.86

176,7

06.88

146,4

02.90

118,89

11.81

135,73

07.83

178,64

03.85

99,31

11.86

141,87

07.88

165,19

03.90

121,24

12.81

112,58

08.83

112,14

04.85

105,3

12.86

115,63

08.88

179,38

04.90

133,58

01.82

98,29

09.83

140,58

05.85

129,18

01.87

111,29

09.88

180,97

05.90

150,83

02.82

87,98

10.83

134,37

06.85

149,05

02.87

108,49

10.88

158,83

06.90

160,84

03.82

85,18

11.83

120,24

07.85

159,66

03.87

107,97

11.88

129,38

07.90

172,76

04.82

100,48

12.83

114,18

08.85

150,55

04.87

111,43

12.88

115,28

08.90

176,75

05.82

131,98

01.84

99,49

09.85

141,61

05.87

146,49

01.89

110,96

09.90

164,63

06.82

148,97

02.84

102,5

10.85

115,94

06.87

172,69

02.89

101,36

10.90

138,38

07.82

169,57

03.84

107,16

11.85

108,91

07.87

178,21

03.89

94,57

11.90

120,55

08.82

164,2

04.84

121,67

12.85

103,61

08.87

203,72

04.89

113,33

12.90

96,79


 

ДЕСКРИПТИВНЫЙ АНАЛИЗ ВРЕМЕННЫХ РЯДОВ 

(описательные  методы, обеспечивающие вывод графиков  временного ряда, автокорреляции, периодограммы)

1.Задание переменной и вывод графика временного ряда

Загрузим файл с исходными данными задачи. Выберем модуль Time series analysis & forecasting (Анализ временных рядов и прогнозирование). (Рис.1)

  

Рис. 1 Исходные данные

Заполним диалоговое окно Time Series Analysis (Рис.2):

1) Нажатием кнопки Variables (Переменные) в левом верхнем углу вызывается диалоговое окно Select Variables for time series analyses,

2) В списке переменных этого окна делается щелчок по имени Var2, что фиксируется в поле Select variables как 2.

Рис.2 Заполнение данных в  окне Time Series Analysis

Введенная переменная отмечается на стартовой панели также в поле столбца Variable, в поле соседнего столбца Long variable (series) name (Длинное имя переменной (рядов)) автоматически выводится соответствующее длинное имя, если оно было присвоено. В поле столба Lock (Блокировка), расположенном слева от столбца с именем переменной, автоматически вводится метка L, обозначающая блокировку переменной, т.е. невозможность ее удаления до завершения анализа.

В диалоговом окне единственная переменная по умолчанию выделена (активна). Из окна Transformations of Variables с помощью кнопок выводятся:

  • Review highlighted variable – значения выделенной переменной,
  • Plot – график динамики временного ряда, на котором по оси абсцисс откладываются номера по порядку или периоды и по оси ординат – уровни,
  • Histogram – гистограмма выделенной переменной,
  • Normal plot – спрямляющая диаграмма для тестирования распределения выделенной переменной по нормальному закону.

На графике динамики временного ряда по умолчанию на оси абсцисс  откладываются номера по порядку  и на оси ординат – значения уровней. Оцифровка оси абсцисс  определяется при выборе меток в  блоке Label data points with, где по умолчанию установлен флажок Case number (Номер варианты). Чтобы оцифровать ось абсцисс в календарных обозначениях месяцев и лет, используется флажок Data, var (Данные из переменной). При этом появляется диалоговое окно Select the variable with dates, в котором выбирается параметр Var1. (Рис.3)

Рис.3 Выбор переменной в окне Transformations of Variables

Затем в диалоговом окне Transformations of Variables устанавливается флажок Scale x axis in plots manually (min, step) и ниже в поле Min= вводится 1, а в поле Step= вводится 12. Теперь кнопка Plot выводит график динамики временного ряда, на котором по оси абсцисс откладываются периоды (в месяцах), по оси ординат – уровни. (Рис.4)

Рис.4 График динамики временного ряда

Из графика видно, что  временной ряд имеет отчетливо  выраженную циклическую компоненту с максимумами в середине каждого  года. Визуально на графике не заметно  тенденций к общему понижению  или повышению. Такие временные  ряды относятся к стационарному  типу.

2. Оценка регулярности временного  ряда

 

Пакет позволяет численно и графически оценить регулярность временного ряда, т.е. выяснить является ли он полностью случайным (белым  шумом) или включает регулярную составляющую.

Регулярность временного ряда характеризуется его внутренней структурой – связью уровней, что  оценивается коэффициентом корреляции между уровнями xt и сдвинутыми относительно них уровнями xt+L, где t – период, а L – так называемый лаг (задержка, сдвиг), те. число периодов между рассматриваемыми уровнями. При этом L≥1, а верхняя граница L зависит от общего числа периодов и образуемого количества пар xt и xt+L. Такая корреляция между сдвинутыми уровнями одного и того же временного ряда иногда называется серийной корреляцией или автокорреляцией. Она характеризует тесноту связи между сдвинутыми уровнями. Если временной ряд содержит регулярную составляющую, то уровни изменяются не совсем случайно, между ними существует связь, и коэффициент автокорреляции, по крайней мере при небольших лагах, по абсолютной величине значимо отличается от нуля. По мере увеличения лага, если регулярная составляющая нелинейна, сила связи, как правило, уменьшается. Для полностью случайного временного ряда (типа белого шума), когда уровни изменяются случайным образом, коэффициент автокорреляции близок к нулю.

Кнопка Autocorrelations в диалоговом окне Transformations of Variables позволяет построить график и вывести таблицу автокорреляционной функции (АКФ). (Рис.5) На полученном графике заметно циклическое поведение коэффициента автокорреляции при увеличении лагов, которое позволяет сделать следующее утверждение: наличие регулярности временного ряда и сезонности, отвечающей колебаниям уровней, близким к гармоническим. Т.е., отмечавшаяся цикличность уровней на графике временного ряда находит подтверждение и на графике коэффициентов автокорреляции.

В полученных таблице и коррелограмме содержатся следующие данные:

  • оценки коэффициентов автокорреляции – на коррелограмме (откладываются по оси абсцисс и приводятся в столбце corr.) и в столбце Autocorr. таблицы,
  • лаги (от первого до указанного в поле N of lags) – на коррелограмме (отложены по оси ординат и приведены в столбце Lag) и в столбце Lag таблицы,
  • стандартные погрешности оценок коэффициентов автокорреляции или, если выбран флажок White noise standard errors, стандартные отклонения для полностью случайного временного ряда (белого шума) – на коррелограмме (в столбце S. E. и удвоенные значения откладываются по оси абсцисс, выделяя область возможных ошибок) и в столбце Std. Err. таблицы,
  • накопительные суммы квадратов оценок коэффициентов автокорреляции для данного и предшествующих лагов (по формуле Бокса-Лянга) – в виде столбца Box & Ljung Q в таблице и столбца Q на коррелограмме,

- р – вероятности ошибок при отклонении гипотезы о малой статистической значимости суммы квадратов коэффициентов автокорреляции – вероятности того, что эти суммы равны нулю.

 

 

Рис.5 График и таблица автокорреляционной функции (АКФ)

Частная автокорреляционная функция (ЧАКФ) имеет  выделяющееся значение на лаге 1 (что  еще раз подтверждает наличие  сезонной компоненты), почти все  остальные значения экспоненциально  убывают. (Рис.6)

В полученных таблице и коррелограмме содержатся следующие данные:

  • оценки частных коэффициентов автокорреляции – на коррелограмме (откладываются по оси абсцисс и приводятся в столбце corr.) и в столбце Partial-auto c. таблицы,
  • лаги (от первого до указанного в поле N of lags) – на коррелограмме (отложены по оси ординат и приведены в столбце Lag) и в столбце Lag таблицы,
  • стандартные погрешности оценок коэффициентов частной автокорреляции – на коррелограмме (в столбце S. E. и удвоенные значения откладываются по оси абсцисс, выделяя область возможных ошибок) и в столбце Std. Err. таблицы.

 

Рис.6 График и таблица частной автокорреляционной функции (ЧАКФ)

3. Оценка сезонной компоненты  временного ряда

 

Для этого необходимо подвергнуть  временной ряд спектральному  анализу для нахождения периода  колебаний. Спектральный анализ активизируется кнопкой Spectral (Fourier) analysis (Спектральный (Фурье) анализ) в диалоговом окне Time Series Analysis. Кнопка Ок (Single series Fourier analysis (Анализ Фурье единичного ряда)) выведет окно результатов спектрального анализа. (Рис.7) В нижней строке информационного окна показаны пять наибольших пиков периодограммы по частоте (Frequency).

Рис.7 Результаты спектрального  анализа

Кнопка Summary (Итог) позволяет узнать период, соответствующий наибольшему значению периодограммы (в таблице с квадратами амплитуд синусоидальных гармоник Фурье для последовательности частот значимые величины подсвечены красным)(Рис.8). В первом столбце приведены частоты, во втором текущие периоды, а в пятом – Periodog, квадраты амплитуд синусоидальных гармоник Фурье. При просмотре пятого столбца рекомендуется обратить внимание на частоту 0,083333 (с текущим периодом 12), при которой квадрат амплитуды возрастает в 100 раз – до 100669,8. Это и есть проявление сезонности с указанной частотой и периодом. Более наглядно сезонность проявляется на периодограмме.

Рис.8 Таблица с квадратами амплитуд синусоидальных гармоник Фурье

В правой нижней части окна расположена кнопка Periodogram (Периодограмма), позволяющая построить периодограмму ряда, расположив по оси Х частоты (Frequency) или периоды (Period). Поскольку единицей времени является месяц, то указывавшийся период с максимальной абсолютной величиной амплитуды имеет продолжительность 12 месяцев. (Рис.9)

 

Рис.9 Периодограмма ряда

СГЛАЖИВАНИЕ, СЕЗОННАЯ ДЕКОМПОЗИЦИЯ И ПРОГНОЗИРОВАНИЕ  ВРЕМЕННОГО РЯДА

Такой анализ выполняется  средствами модуля Time series Analysis:

  • ARIMA (Box & Jenkins) & autocorrelation  (АРИМА по Боксу – Дженкинсу и автокорреляция) имеет две модификации в зависимости от типа временного ряда
  1. ARIMA & autocorrelation functions (АРПСС – модель авторегрессии и проинтегрированного скользящего среднего) для временных рядов с непрерывной регулярной составляющей и случайными изменениями уровней, отвечающими дисперсии случайной составляющей,
  1. Interrupted time series analysis (Анализ прерванного временного ряда) для временных рядов со скачкообразным изменением (разрывом первого рода) регулярной составляющей, значимо превышающим амплитуды случайных колебаний уровней.
  • Exponential smoothing & forecasting (Экспоненциальное сглаживание и прогнозирование),
  • Seasonal decomposition (Census 1) (Сезонная декомпозиция),
  • X11 (Census 2) – monthly – quarterly (Х11 метод – для месяцев – для кварталов),
  • Distributed lags analysis (Анализ распределительных лагов),
  • Spectral (Fourier) analysis (Спектральный (Фурье) анализ).

В правом нижнем углу стартовой панели размещена область Replace missing date with (Замена отсутствующего (пропущенного) уровня) со списком возможных способов замены: общим средним, интерполированной величиной и др.

С использованием встроенных инструментов можно попытаться подобрать подходящий вариант сглаживания для анализируемого временного ряда. Подбор облегчается  возможностью мгновенной одновременной  визуализации вариантов сглаживания  и остатков. Критериями подходящего  выбора являются:

  • соответствие сглаженных значений представлениям о закономерном поведении регулярной составляющей временного ряда, достаточной гладкости графика и степени приближения к временному ряду с учетом выявленной сезонности,
  • адекватность остатков понятию и, если есть, статистическим характеристикам случайной составляющей, обычно подчиняющейся нормальному закону.

Информация о работе Применение пакета Statistica при анализе и прогнозе временного ряда