Прогнозирование в индустрии гостеприимства и туризма

Автор работы: Пользователь скрыл имя, 08 Декабря 2011 в 00:01, курсовая работа

Описание работы

Цель данной работы заключается в построении прогноза по статистическим данным индустрии гостеприимства собранным за несколько предыдущих лет и анализ прогноза на будущий период.
Задачи данной работы могут быть сформулированы следующим образом: раскрытие понятия о временных рядах и существующих в индустрии гостеприимства методах построения прогнозов; приведение конкретного примера с помощью программы Statgraphics Plus - анализ данных по ежемесячной загрузке гостиниц Северной Ирландии, выявление трендов и моделей сезонности, анализ случайности; построение прогноза с помощью функции автоматическое прогнозирование и анализ полученных данных с их дальнейшей трактовкой и выработкой конкретных рекомендаций и выводов по данной ситуации.

Содержание работы

Введение…………………………………………………………….……………3



I. Теоретическое обоснование прогнозирования в индустрии гостеприимства и туризма
Сущность и методы прогнозирования…………………………….…….….5

Понятие временных рядов и основные этапы их анализа……………....…7

Общая характеристика STATGRAPHICS и его особенности………….....10


II. Анализ временных рядов в STATGRAPHICS…………………………..12

III. Автоматическое прогнозирование временных рядов………………...22


Заключение………………………………………………………………….…..31
Список использованной литературы……………

Файлы: 1 файл

стат графикс.docx

— 203.86 Кб (Скачать файл)

     Не  существует "автоматического" способа  обнаружения тренда в временном  ряде. Однако если тренд является монотонным (устойчиво возрастает или устойчиво  убывает), то анализировать такой  ряд обычно нетрудно. Если временные  ряды содержат значительную ошибку, то первым шагом выделения тренда является сглаживание.

     Сглаживание. Сглаживание всегда включает некоторый способ локального усреднения данных, при котором несистематические компоненты взаимно погашают друг друга. Самый общий метод сглаживания - скользящее среднее, в котором каждый член ряда заменяется простым или взвешенным средним n соседних членов, где n - ширина "окна" (см. Бокс и Дженкинс, 1976; Velleman and Hoaglin, 1981). Вместо среднего можно использовать медиану значений, попавших в окно. Основное преимущество медианного сглаживания, в сравнении со сглаживанием скользящим средним, состоит в том, что результаты становятся более устойчивыми к выбросам (имеющимся внутри окна). Таким образом, если в данных имеются выбросы (связанные, например, с ошибками измерений), то сглаживание медианой обычно приводит к более гладким или, по крайней мере, более "надежным" кривым, по сравнению со скользящим средним с тем же самым окном. Основной недостаток медианного сглаживания в том, что при отсутствии явных выбросов, он приводит к более "зубчатым" кривым (чем сглаживание скользящим средним) и не позволяет использовать веса.

     Относительно  реже, когда ошибка измерения очень  большая, используется метод сглаживания  методом наименьших квадратов, взвешенных относительно расстояния или метод  отрицательного экспоненциально взвешенного  сглаживания. Все эти методы отфильтровывают  шум и преобразуют данные в  относительно гладкую кривую.

     Периодическая и сезонная зависимость (сезонность) представляет собой другой общий  тип компонент временного ряда. Это  понятие было проиллюстрировано  ранее на примере авиаперевозок  пассажиров. Можно легко видеть, что каждое наблюдение очень похоже на соседнее; дополнительно, имеется повторяющаяся сезонная составляющая, это означает, что каждое наблюдение также похоже на наблюдение, имевшееся в том же самом месяце год назад. В общем, периодическая зависимость может быть формально определена как корреляционная зависимость порядка k между каждым i-м элементом ряда и (i-k)-м элементом (Kendall, 1976). Ее можно измерить с помощью автокорреляции (т.е. корреляции между самими членами ряда); k обычно называют лагом (иногда используют эквивалентные термины: сдвиг, запаздывание). Если ошибка измерения не слишком большая, то сезонность можно определить визуально, рассматривая поведение членов ряда через каждые k временных единиц.

     Автокорреляционная  коррелограмма. Сезонные составляющие временного ряда могут быть найдены с помощью коррелограммы. Коррелограмма (автокоррелограмма) показывает численно и графически автокорреляционную функцию (AКФ), иными словами коэффициенты автокорреляции (и их стандартные ошибки) для последовательности лагов из определенного диапазона (например, от 1 до 30). На коррелограмме обычно отмечается диапазон в размере двух стандартных ошибок на каждом лаге, однако обычно величина автокорреляции более интересна, чем ее надежность, потому что интерес в основном представляют очень сильные автокорреляции. Исследование коррелограмм. При изучении коррелограмм следует помнить, что автокорреляции последовательных лагов формально зависимы между собой.

     Частные автокорреляции. Другой полезный метод исследования периодичности состоит в исследовании частной автокорреляционной функции (ЧАКФ), представляющей собой углубление понятия обычной автокорреляционной функции. В ЧАКФ устраняется зависимость между промежуточными наблюдениями (наблюдениями внутри лага).

     Удаление  периодической зависимости. Как отмечалось выше, периодическая составляющая для данного лага k может быть удалена взятием разности соответствующего порядка. Это означает, что из каждого i-го элемента ряда вычитается (i-k)-й элемент. Имеются два довода в пользу таких преобразований. Во-первых, таким образом можно определить скрытые периодические составляющие ряда. Напомним, что автокорреляции на последовательных лагах зависимы. Поэтому удаление некоторых автокорреляций изменит другие автокорреляции, которые, возможно, подавляли их, и сделает некоторые другие сезонные составляющие более заметными.  Во-вторых, удаление сезонных составляющих делает ряд стационарным, что необходимо для применения АРПСС и других методов, например, спектрального анализа.  

    1. Общая характеристика STATGRAPHICS и его особенности
 

     Statgraphics (STATistical GRAPHICs System) Plus for Windows  - статистическая графическая система Плюс под Windows (SGWIN) – профессиональный статистический пакет для PC совместных персональных компьютеров. Он намного проще прим моделировании, чем электронные таблицы типа EXCEL. В то же время SGWIN более проста в использовании, чем знаменитые большие пакеты типа SAS или SPSS. К ее отличительным чертам можно отнести интерактивную графику другие замечательные свойства – StatFolio (статистический портфель), StatAdvisor (статистический консультант), StatWizard (статистический помощник), StatGallery (статистическая галерея), StatReporter (статистический отчет), Snapstats (быстрый статистический анализ).

     В конце 2000 г. корпорация Statistical Graphics и Manugistics США выпустили пятую версию Statgraphics Plus под Windows.

     Программные модули. Подобно многим статистическим программам Statgraphics состоит из нескольких модулей. Имеется основной или базовый модуль (Base System), содержащий обычно используемые статистические процедуры, включая регрессию и дисперсионный анализ. (ANOVA). Начиная с пятой версии, в базовый модуль входит новая опция – быстрый анализ по имени Snapstats. Кроме основного SGWIN включает и ряд дополнительных модулей.

     Дополнительные  модули появляются в пункте меню Special. Модули анализа временного ряда и расширенного регрессионного анализа – особенно творческие.  Они содержат много дополнительных опций, позволяющих проводить углубленный статистический анализ и прогнозирование данных. В частности, в модуле TSA можно определить структуру ARIMA – ошибок, анализировать статистически прогнозные модели на тестовом множестве.

     Многие  статистические пакеты представляют собой  совокупность взаимосвязанных аналитических  и графических процедур, результаты выполнения которых отображаются в  различных текстовых и графических  панелях. Последние заполняют рабочий  стол неорганизованными отчетами и  графиками в накладывающихся  окнах. Statgraphics лишена этого недостатка. Она упорядочивает статистические действия пользователя с помощью исследований (analyses), портфелей (folios) и галерей (galleries).

     В SGWIN различают несколько типов окон:

Окно – приложение – Application Window;

Окно анализа – Analysis Window;

Окно  электронной таблицы – DataSheet window;

Окно  статистического консультанта – StatAdvisor window;

Окно  коллекций текстовых отчетов  и графиков – StatGallery window;

Окно  комментариев – Comments window;

Окно  статистического отчета – StatReporter window;

Окно  предварительного просмотра вывода на печать – Preview window.

     Таковы  были особенности и краткое описание программы Statgraphics Plus. В следующей главе будет продемонстрирован процесс выполнения прогноза на примере данных, взятых из  сферы гостеприимства. Далее будет представлен детальный анализ этих данных.  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

     II. Анализ временных рядов в STATGRAPHICS 

     Анализ  временных рядов Statgraphics располагает несколькими процедурами, в том числе описательными методами (Descriptive Methods) и сезонной декомпозицией (Seasonal Decomposition).

     Изучая  текстовые и графические отчеты переменной – Occupancy rate (средняя загрузка отелей Северной Ирландии), можно заключить, что переменная не содержит тренд, но четко прослеживаются сезонные колебания. Это продемонстрировано на Рис.1

     

     Рис.1 Горизонтальный график переменной Occupancy rate (ежемесячная загрузка гостиниц Северной Ирландии)

     Учитывая  отсутствующий тренд и наличие  сезонных колебаний, удалим из исходного  ряда несезонные разности первого порядка. После обновления данных, необходимо провести анализ.

     Анализируя  полученные результаты на Рис.2 (Analysis Summary), видно имя анализируемой переменной – Occupancy rate, количество наблюдений – 84, начальное наблюдение, интервал выборки и длина сезонности.

       

     Рис.2 Отчет сводки анализа 

     Для проверки случайного характера распределения  скорректированного временного ряда используется так же отчет о коэффициентах  автокорреляции.

     Рис.3 График автокорреляционной функции для скорректированной  переменной Occupancy rate 

     Проанализировав табличный отчет о коэффициентах  автокорреляции для скорректированной  переменной Occupancy rate, можно сделать вывод, что 2 из 24 автокорреляционных коэффициента являются статистически значимыми с 95% вероятностью, а из этого следует, что данный временной ряд может и не быть полностью случайным (белый шум).

     Этот  вывод подтверждается динамикой  коррелограммы на Рис.3, где 2 столбца  выходят за доверительные границы. Это в очередной раз убеждает, что данный временной ряд может  и не быть полностью случайным (белый  шум).

     Представляет  определенный интерес табличный  отчет о частной автокорреляционной функции. Он отражен в Приложении 1.

     Отчет свидетельствует о том, что только три из 24 коэффициентов частной  автокорреляции статистически существенны. Коэффициент частной автокорреляции функции для 1 лага равен –0,32131, для 4 лага равен –0,277431, а для 22 лага –0,241981 – все они выходят за нижнюю границу доверительной трубки/ равную –0,215134.

     Визуально это хорошо видно на Рис.4, на котором  представлен график частной автокорреляционной функции.

 

     Рис. 4 График частной  автокорреляционной функции для скорректированной  переменной Occupancy rate 

     График  и табличный отчет частной  автокорреляционной функции могут  быть использованы для определения  порядка авторегрессионой модели.

     Анализ  таблицы периодограммы, приведенной  в Приложении 1, позволяет заключить, что у скорректированной переменной Occupancy rate отсутствуют существенно выделяющиеся ординаты. Весь спектр разложен на 42 частоты.

     Можно из вышесказанного сделать заключение, что взятие первых несезонных разностей  устранило сезонные пики, характерные  для исходного временного ряда. Это  наглядно продемонстрировано на Рис. 5.

     Рис.5 График периодограммы  скорректированной  переменной Occupancy rate 

     Более четкое представление о характере  частотных составляющих дает график интегрированной периодограммы. На Рис.6.

     Рис.6 График интегрированной  периодограммы скорректированной  переменной Occupancy rate 

     Из  Рис. 6 видно, что значения интегрированной  периодограммы выходят за 99%-ные  границы Колмогорова-Смирнова. Поэтому  отклонить гипотезу о том, что  скорректированная переменная Occupancy rate является случайной величиной, пока не представляется возможным, так как интегрированная периодограмма пересекает обе доверительные границы Колмогорова-Смирнова.

     Заканчивая  исследование скорректированного временного ряда, опишем текстовый отчет о  тестах на случайность. Он представлен  на Рис.7. Внизу этого отчета представлен  статистический консультант, содержание которого позволяет интерпретировать полученные результаты.

     В отчете содержится три теста: критерий серий, основанный на методе (Runs above and below median), критерий восходящих и нисходящих серий (Runs up and down) и тест Бокса-Пирса (Box-Pierce Test).

     Число серий больше или меньше медианы  у скорректированного ряда составляет 51 при 40,975 серии у случайного ряда. Р-значение равно 0,0319669. Скорректированная переменная Occupancy rate имеет 65 восходящих и нисходящих серий, которые отличаются числом серий в случайном ряде – 55. У теста Бокса-Пирса для первых 24 автокорреляций Р-значение составляет 0,0806472.

Информация о работе Прогнозирование в индустрии гостеприимства и туризма