Автор работы: Пользователь скрыл имя, 28 Апреля 2013 в 15:37, курсовая работа
Целью написания курсовой работы является разработать прогноз товарооборота с использованием программного продукта. Провести анализ розничного товарооборота, планирование (прогноз продаж) как в общем по товарообороту, так и по конкретному предприятию.
Исходя из поставленной цели, в данной работе сформулированы следующие задачи:
сущность основных понятий в области прогнозирования;
признаки классификации, виды прогнозов и их краткая характеристика;
методология подхода и методы разработки прогноза экономических показателей с использованием различных программных продуктов;
проведение анализа показателей эффективности коммерческой работы в розничной торговой организации.
Применение на практике критерия Дарбина-Уотсона основано на сравнении расчетного значения статистики d с пороговыми, граничными значениями 1 d и 2 d .
Граничные значения 1 d и 2 d , зависящие от числа наблюдений n, количества объясняющих переменных в модели, уровня значимости a, находятся по таблицам (авторами критерия составлены таблицы для a = 0,05, a = 0,025 и α = 0,01). Фрагмент таблицы Дарбина-Уотсона с критическими значениями 1 d и 2 d при 5% уровне значимости представлен ниже (см. табл. 2).
Алгоритм выявления автокорреляции остатков на основе критерия Дарбина-Уотсона следующий.
Выдвигается гипотеза 0 H об отсутствии автокорреляции остатков. Пусть альтернативная гипотеза состоит в наличии в остатках положительной автокорреляции первого порядка.
Тогда при сравнении расчетного значения статистики d ( d < 2) с 1 d и 2 d возможны следующие варианты.
1) Если d < 1 d , то гипотеза 0 H об отсутствии автокорреляции отвергается (с вероятностью ошибки, равной α) в пользу гипотезы о положительной автокорреляции.
2) Если d > 2 d , то гипотеза 0 H не отвергается.
3) Если 2 1 d dd ≤ ≤ , то нельзя сделать определенный вывод по имеющимся исходным данным (значение d попало в область неопределенности).
Если альтернативной является гипотеза о наличии в остатках отрицательной автокорреляции первого порядка, то с пороговыми, граничными значениями 1 d и 2 d сравнивается величина d − 4 (при d >2).
При этом возможны следующие варианты.
1) Если 4 –d<d1, то гипотеза 0 H об отсутствии автокорреляции отвергается (с вероятностью ошибки, равной α) в пользу гипотезы об отрицательной автокорреляции.
2) Если 4 –d<d2, то гипотеза 0 H не отвергается.
3) Если d1 ≤ 4 –d≤d2, то нельзя сделать определенный вывод по имеющимся исходным данным.
(Таблица 2)
Данный критерий нельзя использовать, если среди объясняющих переменных содержатся лагированные значения результативного показателя (например, он не применим к моделям авторегрессии).
Таким образом, можно считать, что в случае отсутствия автокорреляции в остатках расчетное значение статистики (2.5) «не слишком отличается» от 2.
Характеристики точности моделей
Важнейшими характеристиками качества
модели, выбранной для прогнозирования,
являются показатели ее точности.
Они описывают величины случайных
ошибок, полученных при использовании
модели. Таким образом, чтобы судить
о качестве выбранной модели, необходимо
проанализировать систему показателей,
характеризующих как
О точности прогноза можно судить по величине ошибки (погрешности) прогноза.
Ошибка прогноза – величина, характеризующая расхождение между фактическими прогнозным значением показателя.
Абсолютная ошибка прогноза определяется по формуле:
,(3.1).
где – прогнозное значение показателя;
yt–фактическое значение.
Эта характеристика имеет ту же размерность, что и прогнозируемый показатель, и зависит от масштаба измерения уровней временного ряда.
На практике широко используется относительная ошибка прогноза, выраженная в процентах относительно фактического значения показателя:
δt= , (3.2).
Также используются средние ошибки по модулю (абсолютные и относительные):
(3.3).
где n – число уровней временного ряда, для которых определялось прогнозное значение.
Из (3.2), (3.3) видно, что если абсолютная и относительная ошибка больше 0, то это свидетельствует о «завышенной» прогнозной оценке, если меньше 0, то прогнозное значение было занижено. Очевидно, что все указанные характеристики могут быть вычислены после того, как период упреждения уже закончился, и имеются фактические данные о прогнозируемом показателе или при рассмотрении показателя на ретроспективном участке.
В последнем случае имеющаяся информация делится на две части: по первой – оцениваются параметры модели, а данные второй части рассматриваются в качестве фактических. Ошибки прогнозов, полученные ретроспективно (на втором участке) характеризуют точность применяемой модели.
На практике при проведении сравнительной оценки моделей могут использоваться такие характеристики качества как дисперсия (S2) или среднеквадратическая ошибка (S):
(3.4).
Чем меньше значения этих характеристик,
тем выше точность модели. На практике
часто в качестве знаменателя
в формуле для дисперсии
где k – число оцениваемых коэффициентов модели.
О точности модели нельзя судить по одному значению ошибки прогноза. Например, если прогнозная оценка месячного уровня производства в июне совпала с фактическим значением, то это не является достаточным доказательством высокой точности модели. Надо учитывать, что единичный хороший прогноз может быть получен и по плохой модели, и наоборот.
Следовательно, о качестве применяемых моделей можно судить лишь по совокупности сопоставлений прогнозных значений с фактическими.
Простой мерой качества прогнозов может стать µ – относительное число случаев, когда фактическое значение охватывалось интервальным прогнозом:
, (3.5).
где р– число прогнозов, подтвержденных фактическими данными;
q – число прогнозов, не подтвержденных фактическими данными.
Когда все прогнозы подтверждаются, то q = 0 и µ = 1.
Если же все прогнозы не подтвердились, то р = 0 и µ = 0.
Отметим, что сопоставление коэффициентов µ для разных моделей может иметь
смысл при условии, что доверительные
вероятности приняты
2. Методические основы
2.1 Обзор программных продуктов
и их возможностей для
Практика показывает, что в настоящее время многие российские компании, занимающиеся проведением маркетинговых исследований, а также отделы маркетинга промышленных и торговых организаций часто используют для анализа получаемых полевых данных весьма ограниченный набор аналитических инструментов, иногда даже вовсе без применения статистики. Вместе с тем именно статистический анализ позволяет вскрыть такие закономерности и внутренние связи в данных, которые невозможно выявить другими средствами. Подтверждение гипотез о наличии связи между переменными, оценка характера данных связей, оценка влияния частных параметров продукта на общее впечатление от него потребителей, сегментирование потребителей, прогнозирование изменений рыночной конъюнктуры — вот лишь некоторые задачи, с успехом решаемые с применением статистических методов анализа. На новый уровень выводит статистические методы применение специализированного программного обеспечения для анализа.
Мы рассмотрим какие существуют методы прогнозирования в трех наиболее часто используемых программных продуктов:
-STATISTICA
-EXCEL
-SPSS
Методы прогнозирования в программе STATISTICA:
Регрессионный анализ (линейная, множественная и нелинейная регрессия);
1. Линейная регрессия.
В программе STATISTICA оценка коэффициентов однофакторной и многофакторной линейной регрессии осуществляется в отдельном модуле Множественная регрессия (Multipleregression). Результаты просматриваются в отдельном окне, где есть коэффициенты, оцененные методом наименьших квадратов, коэффициент детерминации, статистика Фишера оценки значимости регрессии, статистики Стьюдента оценки значимости коэффициентов, коэффициент корреляции (матрица корреляций), статистика ДарбинаУотсона. Существенными недостатками приложения STATISTICA является: во-первых, тот факт, что оценка коэффициентов простой регрессии производится только методом наименьших квадратов; во-вторых, определение наличия гетероскедастичности остатков приходится проводить в отдельном модуле (а именно, с помощью теста Спирмена в модуле непараметрические статистики).
2.Нелинейная регрессия.
Оценка нелинейной регрессии в программе STATISTICA производится в отдельном модуле Нелинейное оценивание (Non-linear,estimation), здесь можно как задать вид зависимости самостоятельно, так и воспользоваться имеющимися: регрессия логит/пробит, регрессия экспоненциального роста, кусочно-линейная регрессия. Для оценки коэффициентов нелинейной регрессии произвольного вида используются итеративные методы, такие как квази-ньютоновский, Хука-Дживса, симплексный и др. Результатами оценки являются лишь индекс детерминации и статистика Фишера. Подбор вида гладкой функции можно осуществить только на основе визуального анализаграфиков.
3. Модели с дискретной зависимой переменной.
Модели бинарного выбора (логит/пробит
модели) легко оцениваются в пакете
STATISTICA в модуле Нелинейное оценивание,
выходными данными служат логарифмическая
функция правдоподобия, ограниченная
логарифмическая функция
Анализ временных рядов (адаптивные модели прогнозирования, методы выделения компонент временного ряда, модели с распределенными лагами);
Анализ временных рядов в
программе STATISTICA осуществляется в модуле
Анализ Временных рядов/
Анализ с панельными данными.
В последнее время широкое
Визуальный анализ представленных данных можно проводить как с учетом структуры панели, так и с учетом объединения данных. Statistica позволяет легко произвести спецификацию модели, учитывающей лаг, а также оценить модель со случайными эффектами, используя тест Хаусмана. Процедуру оценки можно произвести с помощью взвешенного обобщенного МНК. После оценки построенной модели по панельным данным могут быть проанализированы и отображены графически фиксированные и случайные эффекты.
Методы прогнозирования в программе EXCEL:
Метод экспоненциального сглаживания:
Предполагается, что наблюдения некоторой величины X, проводятся через равные промежутки времени. Результат наблюдения обозначим X(t), где – t номер наблюдения. Прогноз P(t+1) для следующего момента времени рассчитывается по формуле:
P(t+1) = P(t) + a(X(t) – P(t)), (4.1).
где a – константа сглаживания, выбирается обычно от 0,2 до 0,3. Большие значения константы сглаживания ускоряют отклик прогноза на скачок наблюдаемого процесса, но могут привести к непредсказуемым выбросам.
Первый раз после начала наблюдений, располагая лишь одним результатом наблюдений X(1), когда прогноза P(1) нет и формулой (1) воспользоваться еще невозможно, в качестве прогноза P(2) следует взять X(1).
Формула (4.1) легко может быть переписана в ином виде:
P(t+1) = (1 – a)P(t) + aX(t), (4.2).
Теперь видно, что при увеличении
константы сглаживания в
Прогнозирование с помощью интервального оценивания:
Метод состоит из следующих этапов:
расчет относительной погрешности отклонения заданных и расчетных данныхпри изменении параметров a и bот нижних значений интервалов an,bn до верхних значений интервалов av, bv с некоторым шагом по каждому параметру;
в процессе расчета с помощью программного блока в MathCAD происходит запоминание всех значений параметров a и b, для которых относи тельная погрешность отклонения заданных и расчетных данных по всем временным точкам прогнозирования меньше или равна заданной погрешности прогнозирования;
по найденным таким образом значениям a и b с помощью стандартных функций MathCADmin и max определяются нижние и верхние границы интервалов.
Корреляционно-регрессионный
Построение и анализ корреляционной модели связи осуществляются с помощью корреляционно-регрессионного анализа, который состоит из следующих этапов:
предварительного априорного анализа;
сбора информации и ее первичной обработки;
построения модели (уравнения регрессии);
оценки и анализа модели.
Все этапы связаны между собой, границы их часто переплетаются и носят условный характер.
Форма корреляционной связи может быть выражена различными математическими функциями. Выбор формы связи решается на основе теоретического анализа существа изучаемых явлений и исследования эмпирических данных.