Прогнозирование объема выручки с помощью анализа временных рядов

Автор работы: Пользователь скрыл имя, 06 Декабря 2015 в 20:20, курсовая работа

Описание работы

Японская компания «MIKASA Corporation» занимает лидирующие позиции по всему миру по продаже волейбольных мячей. На протяжении последних лет фирма достигла значительных успехов, и управление компании решило, что необходимо составить прогноз на 2010 год. Для этого аналитическому отделу компании было поручено на основе данных за 5 лет, составить прогноз, касающийся объема продаж данной продукции, на 2010 год.

Содержание работы

Постановка задачи
Решение задачи:
Определение тренда
Проверка значимости линейной модели
Проверка адекватности линейной модели
Характеристика точности линейной модели
Анализ автокорреляционной функции
Определение сезонных составляющих
Прогнозирование ряда по тренду и сезонной составляющей
Обработка результатов. Построение моделей
Выбор “наилучшей” модели
Вывод
Список использованной литературы

Файлы: 1 файл

ДЃ°аЃҐ В..docx

— 188.31 Кб (Скачать файл)

Московский Государственный Институт Электронной Техники

(Технический Университет)

 

 

 

 

Курсовая работа

по дисциплине

«Исследование операций в экономике»

на тему:

  «Прогнозирование объема выручки с помощью

анализа временных рядов»

 

 

 

Выполнил:

Добров Валентин

ЭУ-23

Проверил:

Ревякин А.М.

 

 

 

 

 

 

Содержание

  1. Постановка задачи

  1. Решение задачи:  

    • Определение тренда

    • Проверка значимости линейной модели

    • Проверка адекватности линейной модели

    • Характеристика точности линейной модели

    • Анализ автокорреляционной функции

    • Определение сезонных составляющих

    • Прогнозирование ряда по тренду и сезонной составляющей

    • Обработка результатов. Построение моделей

    • Выбор “наилучшей” модели

  1. Вывод

  1. Список использованной литературы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.Постановка задачи

 Японская компания «MIKASA Corporation» занимает лидирующие позиции по всему миру по продаже волейбольных мячей. На протяжении последних лет фирма достигла значительных успехов, и управление компании решило, что необходимо составить прогноз на 2010 год. Для этого аналитическому отделу компании было поручено на основе данных за 5 лет, составить прогноз, касающийся объема продаж данной продукции, на 2010 год.

Данные представлены в следующей таблице:

Месяц

Год

2006

2007

2008

2009

2010

2011

Январь

488

537

589

666

752

842

Февраль

410

465

510

614

725

824

Март

592

678

750

864

952

1078

Апрель

712

789

850

964

976

1084

Май

811

890

1012

1156

1234

1352

Июнь

1355

1425

1548

1680

1791

1986

Июль

1458

1535

1668

1802

1924

2012

Август

776

897

980

1092

1201

1314

Сентябрь

666

769

867

964

1082

1192

Октябрь

541

642

764

880

992

1106

Ноябрь

314

448

586

694

788

893

Декабрь

576

630

702

841

956

1006


 

Графически статистические данные выглядят следующим образом:

 

 

 

2. Решение задачи

  • Определение тренда

 

Представим временной ряд в виде суммы тренда и остаточной составляющей, т.е.:                      Yx = ux + εx

В ряде случаев тренд является известной функцией времени. Если функция зависит линейно от параметров, то для определения тренда используются методы регрессионного анализа, и тренд U представляет собой простую линейную регрессию:

U = β0 + β1*x,

где β0 и β1 – параметры линейной регрессии, вычисляющиеся с помощью метода наименьших квадратов (МНК), т.е. из условия минимума суммы квадратов:

2

Из необходимых условий минимума функции Q(β0 , β1):

 
,

получаем формулы для вычисления оценок параметров β0 и β1 регрессии:

.

В нашей задаче

β0 = 663,1

β1 = 8,371

U = 8,371x + 663,1 .

 

 

 

 

  • Проверка значимости модели

 

Линейная регрессионная модель называется значимой, если гипотеза H0: β1 = 0 отклоняется.

Проверим эту гипотезу. Если она верна, то статистика F имеет распределение Фишера с (k - 1) и (n - k) степенями свободы, где n – число наблюдений, k – число параметров модели. Гипотеза H0 принимается на уровне значимости α, если вычисленное значение F меньше  квантили распределения Фишера порядка (1 - α): F(1-α)(k –1, n – k). В этом случае, говорят, что регрессионная модель незначима.

Согласно данным, полученным с помощью пакета “Statistica”, F=16,74407.

Квантиль распределения Фишера равна F0.95(1,70) = 3,977779, что меньше вычисленного значения статистики F. Следовательно, гипотеза Н0 отклоняется, и наша модель значима.1

 

  • Проверка адекватности линейной модели

 

Линейная регрессионная модель называется адекватной, если предсказанные по ней значения зависимой переменной согласуются с результатами наблюдений.

Для проверки адекватности полученной модели необходимо найти остатки ei, где i=1,2,…n, где n – число наблюдений. Для адекватности модели должны выполняться следующие условия:

  • D[ei]= σ2=const : дисперсия остатков постоянна;
  • cov(ei,ej)=0, i≠j, остатки некоррелированны;
  • ei ~ N(0, σ2), остатки имеют нормальное распределение.

Проверим каждое условие по отдельности:

  1. Для адекватной модели дисперсии ошибок наблюдений должны быть постоянны для всех наблюдений. В пакете “Statistica” оценка выполнимости этого условия проводится по графику остатков в зависимости от номера наблюдений. Если все остатки укладываются в симметричную относительно нулевой линии полосу, то дисперсию ошибок наблюдений можно считать постоянной. В нашем случае остатки укладываются в симметричную относительно нулевой линии полосу шириной ± l. Значит, первое условие не выполняется.
  2. Необходимо проверить гипотезу Н0: остатки некоррелированны (т.е.ρ=0) по критерию Дарбина - Уотсона. В качестве альтернативной выберем гипотезу Н1: ρ<0. Рассчитаем статистику , i=2..n. В нашем случае, получаем d=0,653582 и, сравнивая его с табличным значением d2 = 1,67, получаем неравенство 4 – d > d2. Из этого следует, что гипотеза Н0 о некоррелированности остатков принимается на уровне значимости α = 0,05.
  3. Проверим гипотезу о нормальном распределении остатков. Данное условие можно проверить в пакете “Statistica” c помощью специального графика, приведенного ниже:

 По графику видно, что некоторые точки расположены близко к прямой. Значит, можно сделать вывод, что остатки распределены по нормальному закону.

Таким образом, можно считать, что регрессионная модель адекватна результатам наблюдения и может использоваться для прогнозирования.

 

  • Характеристика точности линейной модели.

 

Чтобы охарактеризовать, насколько хорошо линейный тренд представляет основную тенденцию временного ряда, вычисляют остаточную сумму квадратов Qe, оценку дисперсии остатков S2 и коэффициент детерминации R2.

Остаточная сумма квадратов Qe определяется по формуле ;

Необходимо рассчитать суммы квадратов Qy, QR:

;

;

В нашем случае:  Qy = 11289846

                             QR = 2179261

                             Qe = 9110585.

 

Оценка дисперсии остатков определяется по формуле ;

В нашей задаче: S2 = 130151,21.

 

Коэффициент детерминации .

Коэффициент детерминации равен той доле разброса результатов наблюдений (xi,yi), i=1, 2, …, n относительно горизонтальной прямой , которая объясняется этой регрессионной моделью.

В нашей задаче: R2 =0, 19302843   

 

Это значит, что выбранная линейная модель описывает лишь 19% дисперсии ошибок наблюдений. Такой показатель недостаточен для того, чтобы эта модель была принята.

Среднее квадратичное отклонение ошибок наблюдений S=360,76, что говорит о достаточно плохом отображении данных линейной моделью.

 

 

 

 

 

 

 

 

 

  • Анализ автокорреляционной функции.

 

Временным рядом называется последовательность наблюдений, упорядоченная по времени: y1, y2, …, yn, где yt – числа, представляющие наблюдение некоторой переменной в n равностоящих моментов времени t=1,2,…,n. Важнейшей характеристикой временного ряда является автокорреляционная функция:

,

где , k=0,1,…,n-2; t=2,3,…,n.

Величина k, определяющая временной интервал между случайными величинами Y(t) и Y(t+k), для которых вычисляется коэффициент корреляции ρk, называется лагом.

Значения автокорреляционной функции, вычисленные в пакете “Statistica”, следующие:

 

Как видно, между данными есть корреляция, и можно предположить, что между ними существует и сезонная зависимость. Согласно автокорреляционной функции, сезонные колебания будут повторяться каждые 12 месяцев (т.к. наибольшее значение – при лаге №12, равное 0,762). Следовательно, прогноз можно делать на 1 год.

 

 

 

 

 

  • Определение сезонной составляющей ряда (сезонных индексов).

 

Предположим, что исходный ряд представлен мультипликативной моделью:                                         .

 

Так как ряд представляет месячные данные, то вычисляются месячные сезонные индексы: S1, S2, …, S12, сумма которых S1+S2+…+S12=1200%.

Процедура вычисления сезонных индексов состоит из нескольких шагов:

  1. Выделяются тренд и циклическая составляющая при помощи процедуры центрированного скользящего среднего по 12 точкам.
  2. Вычисляются сезонная и остаточная составляющие в процентах делением исходных данных на значение тренда и циклической составляющей, полученных на шаге 1: , где Ц – центрированное скользящее среднее.
  3. Вычисляются среднее результатов шага 2 для каждого месяца: S’1, S’2,…, S’12. При этом минимальные и максимальные значения в совокупностях месячных данных отбрасываются.
  4. Определяется корректирующий коэффициент: .
  5. Определяются скорректированные сезонные индексы: , i=1,2,…,12, сумма которых равна 1200%.

 

Предположим, что исходный ряд представлен аддитивной моделью:

.

В таком случае метод на 2-м, 4-м и 5-м шагах используется следующим образом:

2. После выделения тренда и циклической составляющей вычитают эти компоненты из исходных данных:

4. Сумма сезонных индексов для аддитивной модел должна быть равна нулю, поэтому корректирующий коэффициент вычисляется по формуле:

 

5. Вычисляют скорректированные сезонные индексы:

(i=1,2,…,12)

 

 

 

 

 

 

Сезонные индексы для мультипликативной и аддитивной моделей, вычисленные в пакете “Statistica”, приведены в таблице:

Сезонная состовляющая

Мультипликативная модель

Аддитивная модель

S1

70,1875

-289,528

S2

63,9330

-349,344

S3

87,7819

-122,094

S4

95,1334

-60,311

S5

112,9399

124,739

S6

167,4201

673,139

S7

181,2588

777,172

S8

107,3366

64,139

S9

94,0515

-58,394

S10

81,7307

-173,678

S11

61,1496

-370,844

S12

77,0771

-214,994


 

 

 

  • Прогнозирование ряда по тренду и сезонной составляющей.

Для ряда, представленного мультипликативной моделью , t=1,2,…,n, прогнозируемое значение для t=n+k, вычисляются по формуле , где Si – значение сезонного индекса, соответствующее моменту времени t=n+k, а - прогнозируемое значение тренда.

В случае аддитивной модели прогнозируемое значение на момент t=n+k вычисляется по формуле: .

Для вычисления ошибки прогноза используется следующий метод. Временной ряд y1, y2, …, yn разбивается на две части:

Информация о работе Прогнозирование объема выручки с помощью анализа временных рядов