Контрольная работа по "Статистика"

Автор работы: Пользователь скрыл имя, 13 Октября 2017 в 18:52, контрольная работа

Описание работы

1. Постройте прогноз численности наличного населения города А на 2010-2011 гг., используя методы: скользящей средней, экспоненциального сглаживания, наименьших квадратов.
2. Постройте график фактического и расчетных показателей.
3. Рассчитайте ошибки полученных прогнозов при использовании каждого метода.
4. Сравните полученные результаты, сделайте вывод.

Файлы: 1 файл

2507.решение.doc

— 277.00 Кб (Скачать файл)

 

 

Оглавление

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вариант 1.

Задание 1.

Имеются данные о численности наличного населения города А за 2001–2009 гг. (на начало года), тыс. чел.

2001

2002

2003

2004

2005

2006

2007

2008

2009

119

120

119

118

118,6

118

117,9

117,7

117,4


 

1. Постройте  прогноз численности наличного  населения города А на 2010-2011 гг., используя методы: скользящей средней, экспоненциального сглаживания, наименьших квадратов.

2. Постройте  график фактического и расчетных  показателей.

3. Рассчитайте  ошибки полученных прогнозов  при использовании каждого метода.

4. Сравните полученные  результаты, сделайте вывод.

Решение

Скользящая средняя (n = 3):

m 2002 = (У2001 + У2002 + У 2003)/ 3 = (119+120+119)/3 =119,3

m 2003 = (У2002 + У2003 + У 2004)/ 3 = (120+119+118)/3 = 119

m 2004 = (У2003 + У2004 + У 2005)/ 3 = (119+118+118,6)/3 =118,5

m 2005= (У2004 + У2005 + У 2006)/ 3 = (118+118,6+118)/3 =118,2

m 2006 = (У2005 + У2006 + У 2007)/ 3 = (118,6+118+117,9)/3 =118,2

m 2007 = (У2006 + У2007 + У 2008)/ 3 = (118+117,9+117,7)/3 =117,8

m 2008 = (У2007 + У2008 + У 2009)/ 3 = (117,9+117,7+117,7)/3 =117,8

 

 

Таблица 1

Годы

Данные о численности наличного населения города А, тыс. чел. Уt

Скользящая средняя m

Расчет средней относительной ошибки

|Уф – Ур| Уф * 100

2001

119

-

-

2002

120

119,3

0,58

2003

119

119

0

2004

118

118,5

0,42

2005

118,6

118,2

0,34

2006

118

118,2

0,17

2007

117,9

117,8

0,08

2008

117,7

117,8

0,08

2009

117,7

117,3

-

Итого

   

0,33

Прогноз

2010

117,8

117,755556

 

2011

117,766667

117,77037

 

2012

117,744444

117,758025

 

2013

117,762963

117,757202

 

2014

117,764198

117,761591

 

2015

117,757613

117,760402

 

2016

117,759396

117,759335

 

2017

117,760997

117,760087

 

2018

117,759869

117,760192

 

2019

117,759711

   

 

Рис. 1 График фактических до 2010 года и расчетных показателей с 2010 по 2019 год. (Составлено по таблице 1)

Прогноз на 2010 г.: У2010=117,8+(117,7-117,7)/3=117,8

m 2009 =(117,7+117,7+117,8)/3=117,3

Прогноз на 2011 г.: У2011=117,3+(117,8-117,7)/3=117,766667 и т.д. (Таблица 1).

Средняя относительная ошибка: ε=0,33/7=0,05

Метод экспоненциального сглаживания:

Значение параметра сглаживания: 2/(n+1)=2/(9+1)=0,2

Начальное значение Uo двумя способами:

1 способ (средняя  арифметическая): Uo = 1065,9/9 = 118,4

2 способ (принимаем  первое значение базы прогноза): Uo = 119

 

 

 

Таблица 2

Годы

Данные о численности наличного населения города А, тыс. чел.

Экспоненциально взвешенная средняя Ut

Расчет средней относительной ошибки

У t

1 способ

2 способ

1 способ

2 способ

2001

119

118,4

119

-0,47619048

0

2002

120

118,546667

119

-1,21111111

-0,8333333

2003

119

118,837333

119,2

-0,13669468

0,1680672

2004

118

118,869867

119,16

0,737175141

0,9830508

2005

118,6

118,695893

118,928

0,080854413

0,2765599

2006

118

118,676715

118,8624

0,573487006

0,7308475

2007

117,9

118,541372

118,68992

0,543996381

0,6699915

2008

117,7

118,413097

118,531936

0,605860142

0,7068275

2009

117,7

118,270478

118,365549

0,484688113

0,565462

Итого

1065,9

1067

1069

1,20206493

3,2674731

прогноз

         

2010

 

75,6200847

75,668761

   

2011

 

60,4960678

60,5350088

   

Рис. 2. График фактических и расчетных показателей экспоненциально взвешенных средних 1 и 2 способ. (Составлено по таблице 2)

Экспоненциально взвешенная средняя для каждого года:

U2001 = 117,8*0,2+(1-0,2) * 118,4=118,546667 1 способ

U2001 = 119*0,2+(1-0,2) * 119=119 2 способ

Средняя относительная ошибка:

ε = 1,2/9 = 0,13% (1 способ)

ε = 3,27/9 = 0,36% (2 способ)

Метод наименьших квадратов:

Линейное уравнение тренда имеет вид y = at + b

1. Находим параметры уравнения  методом наименьших квадратов.

Система уравнений МНК:

a0n + a1∑t = ∑y

a0∑t + a1∑t2 = ∑y•t

Для наших данных система уравнений имеет вид:

9a0 + 45a1 = 1065.9

45a0 + 285a1  = 5315.2

Из первого уравнения выражаем а0 и подставим во второе уравнение

Получаем a0 = -0.24, a1 = 119.63

Уравнение тренда:

y = -0.24 t + 119.63

Эмпирические коэффициенты тренда a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.

Коэффициент тренда b = -0.24 показывает среднее изменение результативного показателя (в единицах измерения у) с изменением периода времени t на единицу его измерения. В данном примере с увеличением t на 1 единицу, y изменится в среднем на -0.24.

Ошибка аппроксимации.

Оценим качество уравнения тренда с помощью ошибки абсолютной аппроксимации.

 

Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения тренда к исходным данным.

 

Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве тренда.

Однофакторный дисперсионный анализ.

Средние значения

 

 

 

Дисперсия

 

 

Среднеквадратическое отклонение

 

 

Коэффициент эластичности.

Коэффициент эластичности представляет собой показатель силы связи фактора t с результатом у, показывающий, на сколько процентов изменится значение у при изменении значения фактора на 1%.

 

 

Коэффициент эластичности меньше 1. Следовательно, при изменении t на 1%, Y изменится менее чем на 1%. Другими словами - влияние t на Y не существенно.

Эмпирическое корреляционное отношение.

Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].

 

где

 

В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < η < 0.3: слабая;

0.3 < η < 0.5: умеренная;

0.5 < η < 0.7: заметная;

0.7 < η < 0.9: высокая;

0.9 < η < 1: весьма  высокая;

Полученная величина свидетельствует о том, что изменение временного периода t существенно влияет на y.

Коэффициент детерминации.

 

 

т.е. в 70.13% случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда - высокая.

Таблица 3

t

y

t 2

y 2

t•y

y(t)

(y-y cp) 2

(y-y(t))2

(t-t p) 2

(y-y(t)) : y

1

119

1

14161

119

119.39

0.32

0.15

16

0.0032

2

120

4

14400

240

119.15

2.45

0.73

9

0.0071

3

119

9

14161

357

118.91

0.32

0.008

4

0.0008

4

118

16

13924

472

118.67

0.19

0.45

1

0.0057

5

118.6

25

14065.96

593

118.43

0.0277

0.0277

0

0.0014

6

118

36

13924

708

118.2

0.19

0.038

1

0.0017

7

117.9

49

13900.41

825.3

117.96

0.28

0.0032

4

0.0005

8

117.7

64

13853.29

941.6

117.72

0.54

0.0003

9

0.0002

9

117.7

81

13853.29

1059.3

117.48

0.54

0.0483

16

0.0019

45

1065.9

285

126242.95

5315.2

1065.9

4.86

1.45

60

0.0224


2. Анализ точности определения  оценок параметров уравнения  тренда.

 

Анализ точности определения оценок параметров уравнения тренда

 

 

 

 

S a = 0.055

Доверительные интервалы для зависимой переменной

 

По таблице Стьюдента находим Tтабл

Tтабл (n-m-1;α/2) = (7;0.025) = 2.365

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и t = 6

(119.63 -0.24*6 - 2.365*1.07 ; 119.63 -0.24*6 - 2.365*1.07)

(117.13;119.26)

Интервальный прогноз.

Определим среднеквадратическую ошибку прогнозируемого показателя.

 

m = 1 - количество  влияющих факторов в уравнении  тренда.

 

где L - период упреждения; уn+L - точечный прогноз по модели на (n + L)-й момент времени; n - количество наблюдений во временном ряду; Sy - стандартная ошибка прогнозируемого показателя;  Tтабл - табличное значение критерия Стьюдента для уровня значимости а и для числа степеней свободы, равного n-2.

3. Проверка гипотез относительно  коэффициентов линейного уравнения  тренда.

1) t-статистика. Критерий Стьюдента.

 

 

Статистическая значимость коэффициента a подтверждается

 

 

Статистическая значимость коэффициента b подтверждается

Доверительный интервал для коэффициентов уравнения тренда.

Определим доверительные интервалы коэффициентов тренда, которые с надежность 95%  будут следующими:

(a - tнабл Sa; a + tнабл Sa)

(-0.24 - 2.365•0.055; -0.24 + 2.365•0.055)

(-0.3684;-0.1083)

(b - t набл S b; b + t набл S b)

(119.63 - 2.365•0.31; 119.63 + 2.365•0.31)

(118.8932;120.3568)

2) F-статистика. Критерий Фишера.

 

 

Fkp = 5.32

где m - количество факторов в уравнении тренда (m=1).

Поскольку F > Fkp, то коэффициент детерминации статистически значим

Проверка на наличие автокорреляции остатков.

Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений   от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями.

Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные ряды). Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов и очень редко при использовании перекрестных данных.

В экономических задачах значительно чаще встречается положительная автокорреляция, нежели отрицательная автокорреляция. В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов.

Информация о работе Контрольная работа по "Статистика"