Прогнозирование в индустрии гостеприимства и туризма

Автор работы: Пользователь скрыл имя, 08 Декабря 2011 в 00:01, курсовая работа

Описание работы

Цель данной работы заключается в построении прогноза по статистическим данным индустрии гостеприимства собранным за несколько предыдущих лет и анализ прогноза на будущий период.
Задачи данной работы могут быть сформулированы следующим образом: раскрытие понятия о временных рядах и существующих в индустрии гостеприимства методах построения прогнозов; приведение конкретного примера с помощью программы Statgraphics Plus - анализ данных по ежемесячной загрузке гостиниц Северной Ирландии, выявление трендов и моделей сезонности, анализ случайности; построение прогноза с помощью функции автоматическое прогнозирование и анализ полученных данных с их дальнейшей трактовкой и выработкой конкретных рекомендаций и выводов по данной ситуации.

Содержание работы

Введение…………………………………………………………….……………3



I. Теоретическое обоснование прогнозирования в индустрии гостеприимства и туризма
Сущность и методы прогнозирования…………………………….…….….5

Понятие временных рядов и основные этапы их анализа……………....…7

Общая характеристика STATGRAPHICS и его особенности………….....10


II. Анализ временных рядов в STATGRAPHICS…………………………..12

III. Автоматическое прогнозирование временных рядов………………...22


Заключение………………………………………………………………….…..31
Список использованной литературы……………

Файлы: 1 файл

стат графикс.docx

— 203.86 Кб (Скачать файл)

     Указанные тесты чувствительны к различным  отклонениям от случайного характера  распределения переменной, можно  с уверенностью заявить, что временной  ряд может и не быть полностью  случайным.

             

     Рис. 7 Тесты на случайность  скорректированной  переменной Occupancy rate 

     Таким образом, процедура описательные методы анализа позволила детально исследовать  структуры ежемесячной загрузки гостиниц Северной Ирландии. Указанный  временной ряд не позволяет выделить определенный тренд, но наличие сезонных колебаний несомненно. 

     Моделирование сезонных колебаний.

     Моделирование сезонных колебаний временных рядов  в экономике имеет большое  практическое значение, так многие социально-экономические процессы носят сезонный характер.  В настоящее  время при описании и прогнозировании  тренд-сезонных процессов используются различные методы, связанные с  применением индексов сезонности в  сочетании с кривыми роста. Определенное значение имеют процедуры, опирающиеся  на широкий спектр адаптивных моделей  типа Winter’s и сезонный вариант ARIMA модели. Широкое применение в странах с развитой рыночной экономикой нашел метод Бюро переписи США (Census II) и его последние модификации ARIMA Х11 и ARIMA Х12.

     Наиболее  распространенным методом изучения сезонных процессов является классическая сезонная декомпозиция. Она базируется на возможности представления данных временного ряда в виде двух моделей  – аддитивной и мультипликативной. В этих моделях выделяется три компонента: тренд-цикл, сезонная составляющая и остатки. При аддитивной модели эти компоненты суммируются, при мультипликативной – умножаются.

     Сущность  метода классической декомпозиции базируется на расчете индексов сезонности. Основные этапы классической декомпозиции таковы.

     На  первом этапе осуществляется сглаживание  фактических наблюдений с помощью  центрированной скользящей средней. В  ходе второго этапа устанавливаются  отклонения фактических уровней  временного ряда от его сглаженных значений. На третьем этапе для  элиминирования влияния случайной  компоненты определяется предварительное  значение сезонного коэффициента для  каждого месяца как среднее значение отклонений для одноименных месяцев.

     Завершающий этап классической декомпозиции –  расчет скорректированных коэффициентов  сезонности.

     Для того, чтобы более подробно охарактеризовать отчеты сезонной декомпозиции, нужно  отметить сначала то, что в сводке анализа наряду с общими данными  о временном ряде указывается  модель, с помощью которой осуществлено разложение; формулируется положение  о трехкомпонентном составе ряда.

     Второй  текстовый отчет показывает каждый этап декомпозиции.

     А теперь необходимо прокомментировать  графические опции процедуры  сезонной декомпозиции.

     На  Рис. 8 представлен график тренд-цикла  переменной Occupancy rate. Он отражает долгосрочную тенденцию в динамике загрузки номеров гостиниц Северной Ирландии. На графике точками представлены фактические данные. На этом рисунке видно, что до октября 1998 годы тренд-цикл имел тенденцию к снижению, затем до декабря 1999 года тренд-цикл имел повышающуюся тенденцию, позже наблюдалась некоторая стабилизация в загрузке гостиниц Северной Ирландии, изменения были незначительны, а с октября 2002 года тренд-цикл носил явно повышающуюся тенденцию.

     Рис.8 График тренд-цикла

     Индексы сезонности переменной Occupancy rate представлены на Рис. 9. Они скорректированы таким образом, чтобы их среднее значение равнялось 100%. Наибольший коэффициент сезонности наблюдается в августе, наименьший - январе.

     Рис. 9 Индексы сезонности переменной Occupancy rate

     Следующий Рис.10 отражает динамику иррегулярной (случайной) компоненты переменной Occupancy rate, которая колеблется вокруг среднего значения равного 100%. Наибольший остаток, равный 108.084%, наблюдается в декабре 1997 года.

     Рис 10. Иррегулярная компонента переменной Occupancy rate

     На  Рис.11 представлен график сезонно  скорректированной переменной Occupancy rate. Он отражает динамику двух компонент: тренд-цикла и иррегулярной составляющей. Здесь видно, что определенный тренд выделить невозможно, но колебания случайной величины значительны.

     Рис. 11. Сезонно скорректированная переменная Occupancy rate

     Следующий полезный для анализа график сезонных подпоследовательностей  на Рис.12. Он построен таким образом, чтобы позволить  увидеть каждый компонент сезонного  разложения на одиночном графике. Их число равно количеству месяцев  в году – 12.

     Рис 12. Сезонные подпоследовательности 

     Изучая  расположение горизонтальных линий  всех 12 одиночных графиков, можно  сделать вывод о динамике сезонной компоненты. Наименьший уровень загрузки гостиниц Северной Ирландии приходится на январь, наибольший – на август. Изменение вертикальных столбцов для  каждого месяца позволяет получить представление о тренд-цикле переменной Occupancy rate.

     На  графике Рис.13 представлены 7 графиков динамики уровня загрузки гостиниц Северной Ирландии за период 1997-2003 гг. Для каждого  года построен свой график.

     Рис.13 Годовые субсерии

     Практически все графики подтверждают, что  низкий сезон загрузки гостиниц Северной Ирландии приходится на декабрь и  январь, повышенная загрузка наблюдается  в июне, в июле снова происходит значительный спад, а в августе просматривается пик загрузки гостиниц. После чего снова наступает резкий спад в загрузке гостиниц Северной Ирландии.

     Проведенный анализ переменной Occupancy rate позволяет сделать вывод, что классическая сезонная декомпозиция позволяет детально исследовать структуру временного ряда, выявить закономерности временного ряда его отдельных компонент. Это будет иметь дальнейшее значение для прогнозирования. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

III. Автоматическое прогнозирование временных рядов 
 

       Широкое применение вычислительной техники  и соответствующего программного обеспечения  позволяет автоматизировать процесс  прогнозирования временных рядов. В основе автоматического прогнозирования  лежит идея о построении моделей, объединяющих авторегрессию, скользящее среднее, тренд и сезонные колебания  в единое целое. Объединение различных  методов описания временных рядов  в рамках одной модели позволяет  использовать для прогнозирования  модели невысоких порядков. Это существенно  расширяет область их практического  применения.

     В данной главе будет рассмотрена  процедура автоматического прогнозирования, реализованная в Statgraphics на примере расчета прогнозных значений ежемесячной загрузки гостиниц Северной Ирландии на 24 месяца вперед. Данные сохранены в переменной Occupancy rate.

     Для автоматического прогнозирования  в данном случае выбираем критерий AKAIKE Information Criterion – AIC.

    Рис.14. Фрагмент отчета сравнения моделей при автоматическом прогнозировании

 

       На  Рис.14 представлен фрагмент отчета сравнения моделей при автоматическом прогнозировании. Эта таблица сравнивает результаты подбора различных моделей  к данным. Модель с наименьшим значением  информационного критерия AKAIKE Information Criterion – модель Q, которая была использована для расчета прогноза. Но нужно обратить внимание на то, что выбранная в качестве текущей модель Q, приходит три теста, а еще два она не проходит, так как значения Р в одном случае меньше или равно 0.01, а в другом – меньше или равно 0.001. Статистический консультант для этого отчета, как видно из этого рисунка, сообщает, что модель Q -  ARMA (4,3) SARMA (4,3)  - имеет наименьшее значение информационного критерия. Поэтому она и была выбрана для построения прогнозов. Но так как модель не прошла два теста – тест Бокса-Пирса на чрезмерную автокорреляцию остатков и тест на существенность разности дисперсий.

       Вот именно поэтому необходимо найти  другую модель и выбрать ее для  прогнозирования.

 

       Рис.15. Отчет о тестах на случайность остатков 

       На  Рис.15 три теста были выполнены  для определения случайного характера  остатков. Последовательность случайных  чисел часто называется белым  шумом, так как содержит весь частотный  спектр. Первый тест подсчитал число  серий больше или меньше медианы. Количество таких серий в данном случае – 36, сравнивается с ожидаемым  числом серий – 43 в случайной  выборке. Так как значение Р для этого теста больше или равно 0.10, то нельзя отклонить гипотезу о том, что остатки случайны при 90%-ном и более высоком доверительном уровне. Второй тест подсчитывает число восходящих и нисходящих серий. Фактическое их количество – 56 серии, оно сравнивается с ожидаемым значением 55,6667 для случайного ряда. Так как значение Р для этого теста больше или равно 0.10, то нельзя отклонить гипотезу о том, что остатки случайны при 90%-ном и более высоком доверительном уровне. Третий тест базируется на сумме квадратов первых 24 коэффициентов. Так как значение Р для этого теста также больше или равно 0.10, то нельзя отклонить гипотезу о том, что остатки случайны при 90%-ном и более высоком доверительном уровне. В остатках модели присутствует чрезмерная автокорреляция, а из этого следует, что прогнозирование этой модели может привести к существенной ошибке. Кроме того, о наличии автокорреляции остатков для модели Q -  ARMA (4,3) SARMA (4,3)  свидетельствует и график автокорреляционной функции на Рис.16. Как видно из рисунка, один коэффициент для десятого  лага значимо отличается от нуля.

Рис.16 Автокорреляционная функция остатков 

       Учитывая  результаты проведенного анализа данной переменной, нужно изменить опции  автоматического прогнозирования. Для построения оптимальных прогнозов  установить флажки нужно в текстовых  полях тех моделей, которые в  большей степени соответствуют  характеру динамики ежемесячной  загрузки гостиниц Северной Ирландии. Для окончательного построения адекватной модели были выбраны 4 модели: простое  экспоненциальное сглаживание, квадратическое экспоненциальное сглаживание Браунса, экспоненциальное сглаживание Винтерса и ARMA.

       Так как существует и другой критерий – критерий Шварца, то проверим и  его. Установив в качестве информационного  критерия критерий Шварца, проанализируем полученные результаты.

 

Рис.17. Отчет сравнения моделей при автоматическом прогнозировании 

     На  Рис.17 приведено резюме автоматического  прогнозирования. Из него видно, что  для прогнозирования ежемесячной  загрузки гостиниц Северной Ирландии используется простое экспоненциальное сглаживание с параметром альфа, равным 0,7043. Период упреждения составляет 24 месяца.

     Рис.18 Отчет сравнения  моделей при автоматическом прогнозировании 

     Содержания  отчета на вышеприведенном рисунке  по сравнению моделей автоматического  прогнозирования представлено со всеми  деталями для полного анализа. Из  него видно, что для построения прогнозов  были рассчитаны параметры семи моделей. У простого экспоненциального сглаживания  параметр альфа равен 0.7043, для экспоненциального  сглаживания Винтерса параметр альфа  равен 0.3142, бета – 0.0856, гамма – 0.5546. Модели ARMA параметров не имеют.

       В оцениваемом периоде для  всех семи моделей рассчитаны  семь статистик, модель Q имеет наименьшее значение возможной ошибки – 1.1915.Статистический консультант сообщает, что по критерию Шварца, наилучшая модель для прогнозирования – модель Н. Но необходимо добавить, что только 3 модели проходят все тесты – это модели Н, О, Р. А из этих моделей единственная, которая имеет наименьшую ошибку прогноза – это модель Р. Поэтому на данном этапе именно модель Р является наиболее подходящей для прогнозирования. Но необходимо ее еще проверить по нескольким теста. А для этого используем функции ручного прогнозирования для дополнительной проверки на соответствие и пригодность данной модели. Данная модель ARIMA (3,0,2).

Информация о работе Прогнозирование в индустрии гостеприимства и туризма