Предмет и задачи статистики. Статистическая совокупность. Статистические показатели
Контрольная работа, 03 Июля 2015, автор: пользователь скрыл имя
Описание работы
Статистика – это наука, которая исследует не отдельные факты, а массовые явления и процессы, как множество отдельных факторов, обладающих как индивидуальными, так и общими признаками.
Статистика изучает количественную сторону качественно-определенных массовых, общественных явлений, в данных условиях места и времени.
Файлы: 1 файл
вариант 1.docx
— 87.46 Кб (Скачать файл)
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = Xmax - Xmin
R = 12 - 1 = 11
Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
d = ∑|xi - x| • f;∑f
d = 43.78;20 = 2.19
Каждое значение ряда отличается от другого в среднем на 2.19
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
D = ∑xi - x2 f;∑f
D = 138.18;20 = 6.91
Среднее квадратическое отклонение (средняя ошибка выборки).
σ = D = 6.909 = 2.63
Каждое значение ряда отличается от среднего значения 4.63 в среднем на 2.63
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
v = σ;x = 2.63;4.63100% = 56.77%
Поскольку v>30% ,но v<70%, то вариация умеренная.
Задание 4
На основе интервального вариационного ряда распределения поставщиков товаров магазина определить модальный и медианный размер продолжительности договорных связей по формулам и графическим способом. Рассчитайте показатели формы распределения.
Сделайте выводы. По графическому изображению интервального ряда распределения предприятий визуально определить наличие или отсутствие асимметрии. Рассчитать показатель асимметрии.
Показатели центра распределения.
Средняя взвешенная
x = ∑x • f;∑f
x = 92.6;20 = 4.63
Мода.
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
Mo = x0 + h f2 - f1; f2 - f1 + f2 - f3
где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.
Выбираем в качестве начала интервала 1, так как именно на этот интервал приходится наибольшее количество.
Mo = 1 + 2.2 8 - 0; 8 - 0 + 8 - 5 = 2.6
Наиболее часто встречающееся значение ряда – 2.6
Медиана.
Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.
В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 1 - 3.2, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).
Me = x0 + h;fme ∑f;2 - Sme-1
Me = 3.2 + 2.2;5 20;2 - 8 = 4.08
Таким образом, 50% единиц совокупности будут меньше по величине 4.08.
Определение моды графическим путем
Определение медианы графическим путем
Степень асимметрии.
Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.
Наиболее точным и распространенным показателем асимметрии является моментный коэффициент асимметрии.
As = M3/s3
где M3 - центральный момент третьего порядка.
s - среднеквадратическое отклонение.
M3 = 277.75/20 = 13.89
As = 13.89;2.633 = 0.76
Положительная величина указывает на наличие правосторонней асимметрии
Оценка существенности показателя асимметрии дается с помощью средней квадратической ошибки коэффициента асимметрии:
sAs = 6n-2;n+1n+3
Если выполняется соотношение |As|/sAs < 3, то асимметрия несущественная, ее наличие объясняется влиянием различных случайных обстоятельств. Если имеет место соотношение |As|/sAs > 3, то асимметрия существенная и распределение признака в генеральной совокупности не является симметричным.
Задание 5
Используя данные статистического наблюдения, проведите корреляционно-регрессионный анализ взаимосвязи между продолжительностью договорных связей 20 поставщиков с магазином и качеством поставляемых ими товаров. Осуществите проверку существенности корреляции и достоверности аналитического выражения связи. На основе построенной регрессионной модели спрогнозируйте уровень качества товаров, если средняя продолжительность договорных связей с магазином составит в среднем 10 лет. Сделайте вывод.
Находим параметры уравнения методом наименьших квадратов.
Система уравнений МНК:
№ |
X |
Y |
X2 |
Y2 |
X*Y |
1 |
4 |
96 |
16 |
9216 |
384 |
2 |
3 |
87 |
9 |
7569 |
261 |
3 |
8 |
98 |
64 |
9604 |
784 |
4 |
1 |
89 |
1 |
7921 |
89 |
5 |
1 |
90 |
1 |
8100 |
90 |
6 |
2 |
78 |
4 |
6084 |
156 |
7 |
5 |
98 |
25 |
9604 |
490 |
8 |
6 |
94 |
36 |
8836 |
564 |
9 |
7 |
92 |
49 |
8464 |
644 |
10 |
1 |
91 |
1 |
8281 |
91 |
11 |
12 |
94 |
144 |
8836 |
1128 |
12 |
4 |
87 |
16 |
7569 |
348 |
13 |
6 |
96 |
36 |
9216 |
576 |
14 |
7 |
97 |
49 |
9409 |
679 |
15 |
9 |
92 |
81 |
8464 |
828 |
16 |
1 |
90 |
1 |
8100 |
90 |
17 |
2 |
87 |
4 |
7569 |
174 |
18 |
4 |
81 |
16 |
6561 |
324 |
19 |
5 |
85 |
25 |
7225 |
425 |
20 |
1 |
94 |
1 |
8836 |
94 |
Итого: |
89 |
1816 |
579 |
165464 |
8219 |
Для наших данных система уравнений имеет вид:
Из первого уравнения выражаем а0 и подставим во второе уравнение
Получаем b = 87.448, a = 0.753
Уравнение тренда:
y = 0.753 x + 87.448
Коэффициент тренда b = 0.753 показывает среднее изменение результативного показателя (в единицах измерения у) с изменением периода времени t на единицу его измерения. В данном примере с увеличением t на 1 единицу, y изменится в среднем на 0.753.
Ошибка аппроксимации.
Оценим качество уравнения тренда с помощью средней относительной ошибки аппроксимации.
A = ∑|yt - yi| : yi;n100%
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения тренда к исходным данным.
A = 0.9;20 100% = 4.52%
Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве тренда.
Однофакторный дисперсионный анализ.
Средние значения
y = ∑yi;n = 1816;20 = 90.8
Дисперсия
Dy = ∑y2i;n - y2 = 165464;20 - 90.82 = 28.56
Среднеквадратическое отклонение
σy = Dy = 28.56 = 5.34
Коэффициент эластичности.
Коэффициент эластичности представляет собой показатель силы связи фактора t с результатом у, показывающий, на сколько процентов изменится значение у при изменении значения фактора на 1%.
E = 0.7534.45;90.8 = 0.0369
Коэффициент эластичности меньше 1. Следовательно, при изменении t на 1%, Y изменится менее чем на 1%. Другими словами - влияние t на Y не существенно.
Эмпирическое корреляционное отношение.
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].
η = ∑y - yt2;∑yi - y2 = 103.793;571.2 = 0.426
где
∑y - yt2 = 571.2 - 467.407 = 103.793
В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < η < 0.3: слабая;
0.3 < η < 0.5: умеренная;
0.5 < η < 0.7: заметная;
0.7 < η < 0.9: высокая;
0.9 < η < 1: весьма высокая;
Полученная величина свидетельствует о том, что изменение временного периода t умеренно влияет на y.
Коэффициент детерминации.
R2 = 1 - ∑yi - yt2;∑yi - y2
R2 = 1 - 467.407;571.2 = 0.182
т.е. в 18.17% случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда - низкая.
Анализ точности определения оценок параметров уравнения тренда.
Стандартная ошибка уравнения.
Sy = ∑yi - yt2;n - m - 1
где m = 1 - количество влияющих факторов в модели тренда.
Sy = 467.41;18 = 5.1
Sa = 5.1 579;20 • 3.02 = 2.03
Sb = Sy;nσt = 5.1;3.0220 = 0.38
t-статистика. Критерий Стьюдента.
tb = b;Sb
tb = 0.753;0.38 = 2<2.101
Статистическая значимость коэффициента b не подтверждается
ta = a;Sa
ta = 87.45;2.03 = 43.14>2.101
Статистическая значимость коэффициента a подтверждается
Доверительный интервал для коэффициентов уравнения тренда.
Определим доверительные интервалы коэффициентов тренда, которые с надежность 95% будут следующими:
(b - tнабл Sb; b + tнабл Sb)
(0.753 - 2.101•0.38; 0.753 + 2.101•0.38)
(-0.0383;1.54)
Так как точка 0 (ноль) лежит внутри доверительного интервала, то интервальная оценка коэффициента b статистически незначима.
(a - tнабл Sa; a + tнабл Sa)
(87.448 - 2.101•2.03; 87.448 + 2.101•2.03)
(83.19;91.71)
Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.
При x=10: y = 0.753 *10 + 87.448 =94.978
Список литературы
- Годин А.М. Статистика. Учебник – М., 2002.
- Гусаров В. М. Статистика: учебное пособие для вузов. – М., 2002.
- Ефимова М.Р., Петрова Е.В. Общая теория статистики: Учебник. – М., 1998.
- Котлер Ф., Амстронг Г., Сондерс Дж., Вонг В. Основы маркетинга / Пер. с англ. – 2-е европ. изд. – М.; СПб.; К.: Издат. дом «Вильямс», 1999.
- Мазманова Б.Г. Методические вопросы прогнозирования сбыта // Маркетинг в России и за рубежом. – 2000. – №1.
- Общая теория статистики: Статистическая методология в изучении коммерческой деятельности. Учебник / А.И. Харламов и др. – М. Финансы и статистика, 1998.
- Социальная статистика Учебник. / Под ред. И.И. Елисеевой – 3-е издание, переработанное и дополненное – Москва, "Финансы и статистика", 2001.
- Теория статистики. Учебник. / Под редакцией проф. Р.А. Шмойловой – М., 2000.