Предмет и задачи статистики. Статистическая совокупность. Статистические показатели

Автор работы: Пользователь скрыл имя, 03 Июля 2015 в 00:14, контрольная работа

Описание работы

Статистика – это наука, которая исследует не отдельные факты, а массовые явления и процессы, как множество отдельных факторов, обладающих как индивидуальными, так и общими признаками.
Статистика изучает количественную сторону качественно-определенных массовых, общественных явлений, в данных условиях места и времени.

Файлы: 1 файл

вариант 1.docx

— 87.46 Кб (Скачать файл)

 

 

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = Xmax - Xmin

R = 12 - 1 = 11

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

d = ∑|xi - x| • f;∑f

d = 43.78;20 = 2.19

Каждое значение ряда отличается от другого в среднем на 2.19

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

D = ∑xi - x2 f;∑f

D = 138.18;20 = 6.91

Среднее квадратическое отклонение (средняя ошибка выборки).

σ = D = 6.909 = 2.63

Каждое значение ряда отличается от среднего значения 4.63 в среднем на 2.63

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

v = σ;x = 2.63;4.63100% = 56.77%

Поскольку v>30% ,но v<70%, то вариация умеренная.

 

 

Задание 4

 

На основе интервального вариационного ряда распределения поставщиков товаров магазина определить модальный и медианный размер продолжительности договорных связей по формулам и графическим способом. Рассчитайте показатели формы распределения.

Сделайте выводы. По графическому изображению интервального ряда распределения предприятий визуально определить наличие или отсутствие асимметрии. Рассчитать показатель асимметрии.

Показатели центра распределения.

Средняя взвешенная

x =  ∑x • f;∑f

x = 92.6;20 = 4.63

Мода.

Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Mo = x0 + h f2 - f1; f2 - f1 + f2 - f3

где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.

Выбираем в качестве начала интервала 1, так как именно на этот интервал приходится наибольшее количество.

Mo = 1 + 2.2  8 - 0; 8 - 0 + 8 - 5 = 2.6

Наиболее часто встречающееся значение ряда – 2.6

Медиана.

Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.

В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 1 - 3.2, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

Me = x0 + h;fme   ∑f;2 - Sme-1

Me = 3.2 + 2.2;5   20;2 - 8  = 4.08

Таким образом, 50% единиц совокупности будут меньше по величине 4.08.

Определение моды графическим путем

Определение медианы графическим путем

Степень асимметрии.

Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.

Наиболее точным и распространенным показателем асимметрии является моментный коэффициент асимметрии.

As = M3/s3

где M3 - центральный момент третьего порядка.

s - среднеквадратическое  отклонение.

M3 = 277.75/20 = 13.89

As = 13.89;2.633 = 0.76

Положительная величина указывает на наличие правосторонней асимметрии

Оценка существенности показателя асимметрии дается с помощью средней квадратической ошибки коэффициента асимметрии:

sAs = 6n-2;n+1n+3

Если выполняется соотношение |As|/sAs < 3, то асимметрия несущественная, ее наличие объясняется влиянием различных случайных обстоятельств. Если имеет место соотношение |As|/sAs > 3, то асимметрия существенная и распределение признака в генеральной совокупности не является симметричным.

 

Задание 5

Используя данные статистического наблюдения, проведите корреляционно-регрессионный анализ взаимосвязи между продолжительностью договорных связей 20 поставщиков с магазином и качеством поставляемых ими товаров. Осуществите проверку существенности корреляции и достоверности аналитического выражения связи. На основе построенной регрессионной модели спрогнозируйте уровень качества товаров, если средняя продолжительность договорных связей с магазином составит в среднем 10 лет. Сделайте вывод.

 Находим параметры  уравнения методом наименьших  квадратов.

Система уравнений МНК:

 

X

Y

X2

Y2

X*Y

1

4

96

16

9216

384

2

3

87

9

7569

261

3

8

98

64

9604

784

4

1

89

1

7921

89

5

1

90

1

8100

90

6

2

78

4

6084

156

7

5

98

25

9604

490

8

6

94

36

8836

564

9

7

92

49

8464

644

10

1

91

1

8281

91

11

12

94

144

8836

1128

12

4

87

16

7569

348

13

6

96

36

9216

576

14

7

97

49

9409

679

15

9

92

81

8464

828

16

1

90

1

8100

90

17

2

87

4

7569

174

18

4

81

16

6561

324

19

5

85

25

7225

425

20

1

94

1

8836

94

Итого:

89

1816

579

165464

8219




 

 

Для наших данных система уравнений имеет вид:

 

Из первого уравнения выражаем а0 и подставим во второе уравнение

Получаем b = 87.448, a = 0.753

Уравнение тренда:

y = 0.753 x + 87.448

Коэффициент тренда b = 0.753 показывает среднее изменение результативного показателя (в единицах измерения у) с изменением периода времени t на единицу его измерения. В данном примере с увеличением t на 1 единицу, y изменится в среднем на 0.753.

Ошибка аппроксимации.

Оценим качество уравнения тренда с помощью средней относительной ошибки аппроксимации.

A = ∑|yt - yi| : yi;n100%

Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения тренда к исходным данным.

A = 0.9;20 100% = 4.52%

Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве тренда.

Однофакторный дисперсионный анализ.

Средние значения

 

y = ∑yi;n =  1816;20 = 90.8

 

Дисперсия

 

Dy = ∑y2i;n - y2 =  165464;20 - 90.82 = 28.56

Среднеквадратическое отклонение

 

σy = Dy =  28.56 = 5.34

Коэффициент эластичности.

Коэффициент эластичности представляет собой показатель силы связи фактора t с результатом у, показывающий, на сколько процентов изменится значение у при изменении значения фактора на 1%.

 

E = 0.7534.45;90.8 = 0.0369

Коэффициент эластичности меньше 1. Следовательно, при изменении t на 1%, Y изменится менее чем на 1%. Другими словами - влияние t на Y не существенно.

Эмпирическое корреляционное отношение.

Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].

η = ∑y - yt2;∑yi - y2 = 103.793;571.2 = 0.426

где

∑y - yt2 = 571.2 - 467.407 = 103.793

В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < η < 0.3: слабая;

0.3 < η < 0.5: умеренная;

0.5 < η < 0.7: заметная;

0.7 < η < 0.9: высокая;

0.9 < η < 1: весьма высокая;

Полученная величина свидетельствует о том, что изменение временного периода t умеренно влияет на y.

Коэффициент детерминации.

R2 = 1 - ∑yi - yt2;∑yi - y2

R2 = 1 - 467.407;571.2 = 0.182

т.е. в 18.17% случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда - низкая.

Анализ точности определения оценок параметров уравнения тренда.

Стандартная ошибка уравнения.

Sy =  ∑yi - yt2;n - m - 1

где m = 1 - количество влияющих факторов в модели тренда.

Sy = 467.41;18 = 5.1

 

Sa = 5.1  579;20 • 3.02 = 2.03

Sb = Sy;nσt = 5.1;3.0220 = 0.38

t-статистика. Критерий Стьюдента.

tb = b;Sb

tb = 0.753;0.38 = 2<2.101

Статистическая значимость коэффициента b не подтверждается

ta = a;Sa

ta = 87.45;2.03 = 43.14>2.101

Статистическая значимость коэффициента a подтверждается

Доверительный интервал для коэффициентов уравнения тренда.

Определим доверительные интервалы коэффициентов тренда, которые с надежность 95%  будут следующими:

(b - tнабл Sb; b + tнабл Sb)

(0.753 - 2.101•0.38; 0.753 + 2.101•0.38)

(-0.0383;1.54)

Так как точка 0 (ноль) лежит внутри доверительного интервала, то интервальная оценка коэффициента b статистически незначима.

(a - tнабл Sa; a + tнабл Sa)

(87.448 - 2.101•2.03; 87.448 + 2.101•2.03)

(83.19;91.71)

Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.

При x=10: y = 0.753 *10 + 87.448 =94.978

 

Список литературы

  1. Годин А.М. Статистика. Учебник – М., 2002.
  2. Гусаров В. М. Статистика: учебное пособие для вузов. – М., 2002.
  3. Ефимова М.Р., Петрова Е.В. Общая теория статистики: Учебник. – М., 1998.
  4. Котлер Ф., Амстронг Г., Сондерс Дж., Вонг В. Основы маркетинга / Пер. с англ. – 2-е европ. изд. – М.; СПб.; К.: Издат. дом «Вильямс», 1999.
  5. Мазманова Б.Г. Методические вопросы прогнозирования сбыта // Маркетинг в России и за рубежом. – 2000. – №1.
  6. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности. Учебник / А.И. Харламов и др. – М. Финансы и статистика, 1998.
  7. Социальная статистика Учебник. / Под ред. И.И. Елисеевой – 3-е издание, переработанное и дополненное – Москва, "Финансы и статистика", 2001.
  8. Теория статистики. Учебник. / Под редакцией проф. Р.А. Шмойловой – М., 2000.

 

 

 

 


Информация о работе Предмет и задачи статистики. Статистическая совокупность. Статистические показатели