Предмет и задачи статистики. Статистическая совокупность. Статистические показатели

Автор работы: Пользователь скрыл имя, 03 Июля 2015 в 00:14, контрольная работа

Описание работы

Статистика – это наука, которая исследует не отдельные факты, а массовые явления и процессы, как множество отдельных факторов, обладающих как индивидуальными, так и общими признаками.
Статистика изучает количественную сторону качественно-определенных массовых, общественных явлений, в данных условиях места и времени.

Скачать архив (21.87 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

вариант 1.docx

— 87.46 Кб (Скачать файл)

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = Xmax - Xmin

R = 12 - 1 = 11

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

d = ∑|xi - x| • f;∑f

d = 43.78;20 = 2.19

Каждое значение ряда отличается от другого в среднем на 2.19

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

D = ∑xi - x2 f;∑f

D = 138.18;20 = 6.91

Среднее квадратическое отклонение (средняя ошибка выборки).

σ = D = 6.909 = 2.63

Каждое значение ряда отличается от среднего значения 4.63 в среднем на 2.63

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

v = σ;x = 2.63;4.63100% = 56.77%

Поскольку v>30% ,но v<70%, то вариация умеренная.

Задание 4

На основе интервального вариационного ряда распределения поставщиков товаров магазина определить модальный и медианный размер продолжительности договорных связей по формулам и графическим способом. Рассчитайте показатели формы распределения.

Сделайте выводы. По графическому изображению интервального ряда распределения предприятий визуально определить наличие или отсутствие асимметрии. Рассчитать показатель асимметрии.

Показатели центра распределения.

Средняя взвешенная

x = ∑x • f;∑f

x = 92.6;20 = 4.63

Мода.

Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Mo = x0 + h f2 - f1; f2 - f1 + f2 - f3

где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.

Выбираем в качестве начала интервала 1, так как именно на этот интервал приходится наибольшее количество.

Mo = 1 + 2.2 8 - 0; 8 - 0 + 8 - 5 = 2.6

Наиболее часто встречающееся значение ряда – 2.6

Медиана.

Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.

В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 1 - 3.2, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

Me = x0 + h;fme ∑f;2 - Sme-1

Me = 3.2 + 2.2;5 20;2 - 8 = 4.08

Таким образом, 50% единиц совокупности будут меньше по величине 4.08.

Определение моды графическим путем

Определение медианы графическим путем

Степень асимметрии.

Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.

Наиболее точным и распространенным показателем асимметрии является моментный коэффициент асимметрии.

As = M3/s3

где M3 - центральный момент третьего порядка.

s - среднеквадратическое отклонение.

M3 = 277.75/20 = 13.89

As = 13.89;2.633 = 0.76

Положительная величина указывает на наличие правосторонней асимметрии

Оценка существенности показателя асимметрии дается с помощью средней квадратической ошибки коэффициента асимметрии:

sAs = 6n-2;n+1n+3

Если выполняется соотношение |As|/sAs < 3, то асимметрия несущественная, ее наличие объясняется влиянием различных случайных обстоятельств. Если имеет место соотношение |As|/sAs > 3, то асимметрия существенная и распределение признака в генеральной совокупности не является симметричным.

Задание 5

Используя данные статистического наблюдения, проведите корреляционно-регрессионный анализ взаимосвязи между продолжительностью договорных связей 20 поставщиков с магазином и качеством поставляемых ими товаров. Осуществите проверку существенности корреляции и достоверности аналитического выражения связи. На основе построенной регрессионной модели спрогнозируйте уровень качества товаров, если средняя продолжительность договорных связей с магазином составит в среднем 10 лет. Сделайте вывод.

Находим параметры уравнения методом наименьших квадратов.

Система уравнений МНК:

№	X	Y	X2	Y2	X*Y
1	4	96	16	9216	384
2	3	87	9	7569	261
3	8	98	64	9604	784
4	1	89	1	7921	89
5	1	90	1	8100	90
6	2	78	4	6084	156
7	5	98	25	9604	490
8	6	94	36	8836	564
9	7	92	49	8464	644
10	1	91	1	8281	91
11	12	94	144	8836	1128
12	4	87	16	7569	348
13	6	96	36	9216	576
14	7	97	49	9409	679
15	9	92	81	8464	828
16	1	90	1	8100	90
17	2	87	4	7569	174
18	4	81	16	6561	324
19	5	85	25	7225	425
20	1	94	1	8836	94
Итого:	89	1816	579	165464	8219

Для наших данных система уравнений имеет вид:

Из первого уравнения выражаем а0 и подставим во второе уравнение

Получаем b = 87.448, a = 0.753

Уравнение тренда:

y = 0.753 x + 87.448

Коэффициент тренда b = 0.753 показывает среднее изменение результативного показателя (в единицах измерения у) с изменением периода времени t на единицу его измерения. В данном примере с увеличением t на 1 единицу, y изменится в среднем на 0.753.

Ошибка аппроксимации.

Оценим качество уравнения тренда с помощью средней относительной ошибки аппроксимации.

A = ∑|yt - yi| : yi;n100%

Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения тренда к исходным данным.

A = 0.9;20 100% = 4.52%

Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве тренда.

Однофакторный дисперсионный анализ.

Средние значения

y = ∑yi;n = 1816;20 = 90.8

Дисперсия

Dy = ∑y2i;n - y2 = 165464;20 - 90.82 = 28.56

Среднеквадратическое отклонение

σy = Dy = 28.56 = 5.34

Коэффициент эластичности.

Коэффициент эластичности представляет собой показатель силы связи фактора t с результатом у, показывающий, на сколько процентов изменится значение у при изменении значения фактора на 1%.

E = 0.7534.45;90.8 = 0.0369

Коэффициент эластичности меньше 1. Следовательно, при изменении t на 1%, Y изменится менее чем на 1%. Другими словами - влияние t на Y не существенно.

Эмпирическое корреляционное отношение.

Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].

η = ∑y - yt2;∑yi - y2 = 103.793;571.2 = 0.426

где

∑y - yt2 = 571.2 - 467.407 = 103.793

В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < η < 0.3: слабая;

0.3 < η < 0.5: умеренная;

0.5 < η < 0.7: заметная;

0.7 < η < 0.9: высокая;

0.9 < η < 1: весьма высокая;

Полученная величина свидетельствует о том, что изменение временного периода t умеренно влияет на y.

Коэффициент детерминации.

R2 = 1 - ∑yi - yt2;∑yi - y2

R2 = 1 - 467.407;571.2 = 0.182

т.е. в 18.17% случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда - низкая.

Анализ точности определения оценок параметров уравнения тренда.

Стандартная ошибка уравнения.

Sy = ∑yi - yt2;n - m - 1

где m = 1 - количество влияющих факторов в модели тренда.

Sy = 467.41;18 = 5.1

Sa = 5.1 579;20 • 3.02 = 2.03

Sb = Sy;nσt = 5.1;3.0220 = 0.38

t-статистика. Критерий Стьюдента.

tb = b;Sb

tb = 0.753;0.38 = 2<2.101

Статистическая значимость коэффициента b не подтверждается

ta = a;Sa

ta = 87.45;2.03 = 43.14>2.101

Статистическая значимость коэффициента a подтверждается

Доверительный интервал для коэффициентов уравнения тренда.

Определим доверительные интервалы коэффициентов тренда, которые с надежность 95% будут следующими:

(b - tнабл Sb; b + tнабл Sb)

(0.753 - 2.101•0.38; 0.753 + 2.101•0.38)

(-0.0383;1.54)

Так как точка 0 (ноль) лежит внутри доверительного интервала, то интервальная оценка коэффициента b статистически незначима.

(a - tнабл Sa; a + tнабл Sa)

(87.448 - 2.101•2.03; 87.448 + 2.101•2.03)

(83.19;91.71)

Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.

При x=10: y = 0.753 *10 + 87.448 =94.978

Список литературы

Годин А.М. Статистика. Учебник – М., 2002.
Гусаров В. М. Статистика: учебное пособие для вузов. – М., 2002.
Ефимова М.Р., Петрова Е.В. Общая теория статистики: Учебник. – М., 1998.
Котлер Ф., Амстронг Г., Сондерс Дж., Вонг В. Основы маркетинга / Пер. с англ. – 2-е европ. изд. – М.; СПб.; К.: Издат. дом «Вильямс», 1999.
Мазманова Б.Г. Методические вопросы прогнозирования сбыта // Маркетинг в России и за рубежом. – 2000. – №1.
Общая теория статистики: Статистическая методология в изучении коммерческой деятельности. Учебник / А.И. Харламов и др. – М. Финансы и статистика, 1998.
Социальная статистика Учебник. / Под ред. И.И. Елисеевой – 3-е издание, переработанное и дополненное – Москва, "Финансы и статистика", 2001.
Теория статистики. Учебник. / Под редакцией проф. Р.А. Шмойловой – М., 2000.

Информация о работе Предмет и задачи статистики. Статистическая совокупность. Статистические показатели