Автор работы: Пользователь скрыл имя, 06 Декабря 2015 в 20:20, курсовая работа
Японская компания «MIKASA Corporation» занимает лидирующие позиции по всему миру по продаже волейбольных мячей. На протяжении последних лет фирма достигла значительных успехов, и управление компании решило, что необходимо составить прогноз на 2010 год. Для этого аналитическому отделу компании было поручено на основе данных за 5 лет, составить прогноз, касающийся объема продаж данной продукции, на 2010 год.
Постановка задачи
Решение задачи:
Определение тренда
Проверка значимости линейной модели
Проверка адекватности линейной модели
Характеристика точности линейной модели
Анализ автокорреляционной функции
Определение сезонных составляющих
Прогнозирование ряда по тренду и сезонной составляющей
Обработка результатов. Построение моделей
Выбор “наилучшей” модели
Вывод
Список использованной литературы
Японская компания «MIKASA Corporation» занимает лидирующие позиции по всему миру по продаже волейбольных мячей. На протяжении последних лет фирма достигла значительных успехов, и управление компании решило, что необходимо составить прогноз на 2010 год. Для этого аналитическому отделу компании было поручено на основе данных за 5 лет, составить прогноз, касающийся объема продаж данной продукции, на 2010 год.
Данные представлены в следующей таблице:
Месяц |
Год | |||||
2006 |
2007 |
2008 |
2009 |
2010 |
2011 | |
Январь |
488 |
537 |
589 |
666 |
752 |
842 |
Февраль |
410 |
465 |
510 |
614 |
725 |
824 |
Март |
592 |
678 |
750 |
864 |
952 |
1078 |
Апрель |
712 |
789 |
850 |
964 |
976 |
1084 |
Май |
811 |
890 |
1012 |
1156 |
1234 |
1352 |
Июнь |
1355 |
1425 |
1548 |
1680 |
1791 |
1986 |
Июль |
1458 |
1535 |
1668 |
1802 |
1924 |
2012 |
Август |
776 |
897 |
980 |
1092 |
1201 |
1314 |
Сентябрь |
666 |
769 |
867 |
964 |
1082 |
1192 |
Октябрь |
541 |
642 |
764 |
880 |
992 |
1106 |
Ноябрь |
314 |
448 |
586 |
694 |
788 |
893 |
Декабрь |
576 |
630 |
702 |
841 |
956 |
1006 |
Графически статистические данные выглядят следующим образом:
Представим временной ряд в виде суммы тренда и остаточной составляющей, т.е.: Yx = ux + εx
В ряде случаев тренд является известной функцией времени. Если функция зависит линейно от параметров, то для определения тренда используются методы регрессионного анализа, и тренд U представляет собой простую линейную регрессию:
U = β0 + β1*x,
где β0 и β1 – параметры линейной регрессии, вычисляющиеся с помощью метода наименьших квадратов (МНК), т.е. из условия минимума суммы квадратов:
Из необходимых условий минимума функции Q(β0 , β1):
получаем формулы для вычисления оценок параметров β0 и β1 регрессии:
В нашей задаче
β0 = 663,1
β1 = 8,371
U = 8,371x + 663,1 .
Линейная регрессионная модель называется значимой, если гипотеза H0: β1 = 0 отклоняется.
Проверим эту гипотезу. Если она верна, то статистика F имеет распределение Фишера с (k - 1) и (n - k) степенями свободы, где n – число наблюдений, k – число параметров модели. Гипотеза H0 принимается на уровне значимости α, если вычисленное значение F меньше квантили распределения Фишера порядка (1 - α): F(1-α)(k –1, n – k). В этом случае, говорят, что регрессионная модель незначима.
Согласно данным, полученным с помощью пакета “Statistica”, F=16,74407.
Квантиль распределения Фишера равна F0.95(1,70) = 3,977779, что меньше вычисленного значения статистики F. Следовательно, гипотеза Н0 отклоняется, и наша модель значима.1
Линейная регрессионная модель называется адекватной, если предсказанные по ней значения зависимой переменной согласуются с результатами наблюдений.
Для проверки адекватности полученной модели необходимо найти остатки ei, где i=1,2,…n, где n – число наблюдений. Для адекватности модели должны выполняться следующие условия:
Проверим каждое условие по отдельности:
По графику видно, что некоторые точки расположены близко к прямой. Значит, можно сделать вывод, что остатки распределены по нормальному закону.
Таким образом, можно считать, что регрессионная модель адекватна результатам наблюдения и может использоваться для прогнозирования.
Чтобы охарактеризовать, насколько хорошо линейный тренд представляет основную тенденцию временного ряда, вычисляют остаточную сумму квадратов Qe, оценку дисперсии остатков S2 и коэффициент детерминации R2.
Остаточная сумма квадратов Qe определяется по формуле ;
Необходимо рассчитать суммы квадратов Qy, QR:
;
;
В нашем случае: Qy = 11289846
QR = 2179261
Qe = 9110585.
Оценка дисперсии остатков определяется по формуле ;
В нашей задаче: S2 = 130151,21.
Коэффициент детерминации .
Коэффициент детерминации равен той доле разброса результатов наблюдений (xi,yi), i=1, 2, …, n относительно горизонтальной прямой , которая объясняется этой регрессионной моделью.
В нашей задаче: R2 =0, 19302843
Это значит, что выбранная линейная модель описывает лишь 19% дисперсии ошибок наблюдений. Такой показатель недостаточен для того, чтобы эта модель была принята.
Временным рядом называется последовательность наблюдений, упорядоченная по времени: y1, y2, …, yn, где yt – числа, представляющие наблюдение некоторой переменной в n равностоящих моментов времени t=1,2,…,n. Важнейшей характеристикой временного ряда является автокорреляционная функция:
где , k=0,1,…,n-2; t=2,3,…,n.
Величина k, определяющая временной интервал между случайными величинами Y(t) и Y(t+k), для которых вычисляется коэффициент корреляции ρk, называется лагом.
Значения автокорреляционной функции, вычисленные в пакете “Statistica”, следующие:
Как видно, между данными есть корреляция, и можно предположить, что между ними существует и сезонная зависимость. Согласно автокорреляционной функции, сезонные колебания будут повторяться каждые 12 месяцев (т.к. наибольшее значение – при лаге №12, равное 0,762). Следовательно, прогноз можно делать на 1 год.
Предположим, что исходный ряд
представлен мультипликативной
моделью:
Так как ряд представляет месячные данные, то вычисляются месячные сезонные индексы: S1, S2, …, S12, сумма которых S1+S2+…+S12=1200%.
Процедура вычисления сезонных индексов состоит из нескольких шагов:
Предположим, что исходный ряд представлен аддитивной моделью:
В таком случае метод на 2-м, 4-м и 5-м шагах используется следующим образом:
2. После выделения тренда и циклической составляющей вычитают эти компоненты из исходных данных:
4. Сумма сезонных индексов для аддитивной модел должна быть равна нулю, поэтому корректирующий коэффициент вычисляется по формуле:
5. Вычисляют скорректированные сезонные индексы:
(i=1,2,…,12)
Сезонные индексы для мультипликативной и аддитивной моделей, вычисленные в пакете “Statistica”, приведены в таблице:
Сезонная состовляющая |
Мультипликативная модель |
Аддитивная модель |
S1 |
70,1875 |
-289,528 |
S2 |
63,9330 |
-349,344 |
S3 |
87,7819 |
-122,094 |
S4 |
95,1334 |
-60,311 |
S5 |
112,9399 |
124,739 |
S6 |
167,4201 |
673,139 |
S7 |
181,2588 |
777,172 |
S8 |
107,3366 |
64,139 |
S9 |
94,0515 |
-58,394 |
S10 |
81,7307 |
-173,678 |
S11 |
61,1496 |
-370,844 |
S12 |
77,0771 |
-214,994 |
Для ряда, представленного мультипликативной моделью , t=1,2,…,n, прогнозируемое значение для t=n+k, вычисляются по формуле , где Si – значение сезонного индекса, соответствующее моменту времени t=n+k, а - прогнозируемое значение тренда.
В случае аддитивной модели прогнозируемое значение на момент t=n+k вычисляется по формуле: .
Для вычисления ошибки прогноза используется следующий метод. Временной ряд y1, y2, …, yn разбивается на две части:
Информация о работе Прогнозирование объема выручки с помощью анализа временных рядов