Контрольная работа по "Статистике"

Автор работы: Пользователь скрыл имя, 04 Марта 2015 в 11:36, контрольная работа

Описание работы

Задание 1. Описательная статистика
Для заданной выборки определить описательные характеристики двумя способами: первый – используя соответствующие функции, второй – используя режим «Описательная статистика» пакета «Анализ данных», сравнить полученные результаты, сделать выводы об исходной выборке по полученным данным.
Приведем исходные данные для задачи

Файлы: 1 файл

6027_стат.docx

— 193.89 Кб (Скачать файл)

 

 

 

 

Оглавление

 

 

 

Задание 1. Описательная статистика

Для заданной выборки определить описательные характеристики двумя способами: первый – используя соответствующие функции, второй – используя режим «Описательная статистика» пакета «Анализ данных», сравнить полученные результаты, сделать выводы об исходной выборке по полученным данным.

Приведем исходные данные для задачи

Таблица 1

Исходные данные

№ варианта

Выборка данных для задания 1

35

Данные изменения процентной ставки на ссуды (%):

7,000 6,875 6,875 6,750 6,875 7,250 6,875

7,000 6,875 7,000 7,250 7,000 7,000 6,125 6,750


 

Построим ранжированный ряд

Таблица 2

Исходный ранжированный ряд

Данные изменения процентной ставки на ссуды (%):

1

6,125

2

6,750

3

6,750

4

6,875

5

6,875

6

6,875

7

6,875

8

6,875

9

7,000

10

7,000

11

7,000

12

7,000

13

7,000

14

7,250

15

7,250


 

Определим описательные характеристики ряда используя соответствующие функции пакета Excel.

 

 

Таблица 3

Используемые функции Excel для расчета основных характеристик ряда

Расчет основных характеристик ряда

Среднее

=СРЗНАЧ(D5:D19)

Стандартная ошибка

=K9/КОРЕНЬ(K17)

Медиана

=МЕДИАНА(D5:D19)

Мода

=МОДА.ОДН(D5:D19)

Стандартное отклонение

=СТАНДОТКЛОН.В(D5:D19)

Дисперсия выборки

=ДИСП.В(D5:D19)

Эксцесс

=ЭКСЦЕСС(D5:D19)

Асимметричность

=СКОС(D5:D19)

Интервал

=K15-K14

Минимум

=МИН(D5:D19)

Максимум

=МАКС(D5:D19)

Сумма

=СУММ(D5:D19)

Счет

=СЧЁТ(D5:D19)

Наибольший(1)

=НАИБОЛЬШИЙ(D5:D19;1)

Наименьший(1)

=НАИМЕНЬШИЙ(D5:D19;1)


 

Таблица 4

Расчет основных характеристик ряда

Расчет основных характеристик ряда

Среднее

6,900

Стандартная ошибка

0,067

Медиана

6,875

Мода

6,875

Стандартное отклонение

0,260

Дисперсия выборки

0,067

Эксцесс

5,717

Асимметричность

-1,797

Интервал

1,125

Минимум

6,125

Максимум

7,250

Сумма

103,500

Счет

15,000

Наибольший(1)

7,250

Наименьший(1)

6,125


 

Определим описательные характеристики ряда используя режим «Описательная статистика» пакета «Анализ данных»

 

Рис. 1 Окно «Описательная статистика» пакета «Анализ данных»

Результат использования пакета приведен в таблице 5.

 

Таблица 5

Расчетные данные, полученные в режиме «Описательная статистика»

Расчет основных характеристик ряда

Среднее

6,900

Стандартная ошибка

0,067

Медиана

6,875

Мода

6,875

Стандартное отклонение

0,260

Дисперсия выборки

0,067

Эксцесс

5,717

Асимметричность

-1,797

Интервал

1,125

Минимум

6,125

Максимум

7,250

Сумма

103,500

Счет

15,000

Наибольший(1)

7,250

Наименьший(1)

6,125


 

Как видно данные поученные двумя способами совпадают полностью.

Показатели, вычисляемые с помощью описательных статистик, можно разбить на 3 группы – показатели положения вариантов значений признака, вариации признака и особенностей формы его распределения.

  1. Показатели положения описывают положение в первичном ряду данных тех или иных вариантов значений признака, характеризующих ряд. К ним относятся:

– максимальное хmax и минимальное хmin значения признака;

– средняя арифметическая величина x (выступающая в качестве статистической оценки математического ожидания М[x] средней величины признака);

– мода Мо – наиболее часто встречающийся вариант значений признака или тот вариант, который соответствует максимальной ординате эмпирической кривой распределения;

– медиана Me – серединное значение ранжированного ряда вариантов значений признака.

  1. Показатели вариации (колеблемости) признака описывают степень рассеяния вариантов значений признака относительно своего центра x (или Me).

Различают показатели размера и интенсивности вариации.

К показателям размера вариации относятся:

– размах вариации R = хmax –хmin, устанавливающий предельное значение амплитуды колебаний признака;

– межквартильный размах Q3 – Q1, определяющий максимальную амплитуду колебаний в центральной зоне ряда (ограниченной квартилями Q1, и Q3);

– среднее линейное отклонение , вычисляемое как среднее арифметическое из абсолютных отклонений:

 

 – дисперсия  σ2 (или D), рассчитываемая как среднее арифметическое из квадратов отклонений:

 

 

– среднее квадратическое (стандартное) отклонение σ , вычисляемое как корень квадратный из дисперсии:

 

 

Интенсивность вариации признака измеряется относительными показателями:

 

 Показатели R, и σ являются величинами именованными и выражаются в тех же единицах, что и изучаемый признак. Дисперсия σ2 считается безразмерной величиной. Относительные показатели интенсивности вариации, как правило, измеряются процентах.

В статистической практике для оценки вариации наиболее широко применяются показатели размера вариации σ2, σ и показатель интенсивности вариации vσ.

Показатели σ2, σ, основанные на учете отклонений (хi – ) индиви- дуальных значений признака хi от средней арифметической , являются обобщающими характеристиками различия в значениях признака.

Дисперсия σ2 оценивает средний квадрат отклонений (хi – ). Величина σ очень чутко реагирует на вариацию признака (за счет возведения отклонений в квадрат) и органически вписывается в аппарат математической статистики (дисперсионный, корреляционный анализ и др.). На расчете дисперсии основаны многие статистические показатели. Среднее квадратическое отклонение σ показывает, на сколько в среднем отклоняются индивидуальные значения признака хi от их средней величины . Размерность отклонения σ совпадает с размерностью самого признака. Отклонения, выраженные в σ, принято считать стандартными.

Интенсивность вариации обычно измеряют коэффициентом вариации vσ, который выражается в процентах и вычисляется по формуле:

vσ = σ/*100 = 0,97%

Величина vσ оценивает интенсивность колебаний вариантов относительно их средней величины.

Принята следующая оценочная шкала колеблемости признака:

 – 0% < vσ ≤40% – колеблемость незначительная;

– 40% < vσ ≤ 60% – колеблемость средняя (умеренная);

– vσ > 60% – колеблемость значительная.

Для нормальных и близких к нормальному распределений показатель vσ служит индикатором однородности совокупности: принято считать, что при выполнимости неравенства vσ ≤ 33% совокупность является количественно однородной по данному признаку. Коэффициент вариации vσ .часто используется для сравнения колеблемости признаков в различных рядах распределения, когда сравнивается вариация разных признаков в одной и той же совокупности или же вариация одного и того же признака в различных совокупностях, имеющих разные средние x .

  1. Показатели особенностей формы распределения. Для определения типа закономерности эмпирического распределения оно приближенно описывается подходящим теоретическим (вероятностным) распределением, форму кривой которого называют формат распределения. В тех случаях, когда форма распределения анализируется на ее близость к нормальной форме, расхождение между ними оценивается показателями асимметрии и эксцесса. Показатели асимметрии оценивают смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения.

В симметричном распределении максимальная ордината прямой располагается точно в середине кривой, а соответствующие ей характеристики центра распределения совпадают: = Мо = Me.

В случае асимметричного распределения вершина кривой находится не в середине, а сдвинута либо влево, либо вправо. Если вершина сдвинута влево, то правая часть кривой оказывается длиннее левой, т.е. имеет место правосторонняя асимметрия, характеризующаяся неравенством х > Ме > Мо, что означает преимущественное появление в распределении более высоких значений признака. Если же вершина кривой сдвинута вправо и левая часть оказывается длиннее правой, то асимметрия левосторонняя, для которой справедливо неравенство х < Me < Мо, означающее, что в распределении чаще встречаются более низкие значения признака. Чем больше величина расхождения между , Me, Mo, тем более асимметричен ряд. Разности и являются простейшими показателями асимметрии в рядах распределения.

В нормальном и близких к нему распределениях основная масса еди- ниц (почти 70%) располагается в центральной зоне ряда, в диапазоне ( ± δ).

Наиболее точным показателем асимметрии распределения является коэффициент асимметрии As, вычисляемый по формуле:

 

где n – число единиц совокупности.

Чем больше величина As, тем более асимметрично распределение. Установлена следующая оценочная шкала асимметричности:

– As ≤ 0,25 – асимметрия незначительная;

– 0,25< As ≤0,5 – асимметрия заметная (умеренная);

– As >0,5 – асимметрия существенная.

Коэффициент As являются относительными безразмерными величинами, они часто применяются для сравнительного анализа асимметричности различных рядов распределения.

Показатель эксцесса характеризует крутизну кривой распределения – ее заостренность или пологость по сравнению с нормальной кривой. Для оценки расхождений в степени крутизны кривых (при одинаковой силе вариации) применяется коэффициент эксцесса Ek:

 

Как правило, коэффициент эксцесса вычисляется только для симметричных или близких к ним распределений. Это объясняется тем, что за базу сравнения принята кривая нормального распределения, являющаяся симметричной. Относительно вершины нормальной кривой и определяется выпад вверх или вниз вершины теоретической кривой эмпирического распределения.

При этом:

– если Ek >0, то вершина кривой распределения располагается выше вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средним;

– если Ek < 0, то вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin.

В нашем случае As = -1,8 и асимметрия яляется левосторонней, причем весьма существенной. Можно сказать, что ряд распределен не по нормальному закону.

 

Задание 2. Интервальный вариационный ряд

1. По заданной выборке, соответствующей варианту задания  построить интервальный вариационный  ряд; построить гистограмму и  кумуляту (ис-пользуйте два способа: вставку диаграммы Excel и режим «Гистограмма» пакета «Анализ данных»).

2. Проанализировать полученную  гистограмму.

35

Индексы потребительских цен на товары и услуги по Российской Федерации в 2006-2010 гг.


 

Таблица 6

Индексы потребительских цен на товары и услуги по Российской Федерации в 2004-2010гг1

2004

2005

2006

2007

2008

2009

2010

111,7

110,9

109,0

111,9

113,3

108,8

108,8

Информация о работе Контрольная работа по "Статистике"