Автор работы: Пользователь скрыл имя, 14 Июля 2015 в 13:11, шпаргалка
1. Возникновение и понятие статистики как науки.
Статистика – отрасль знания, особая научная дисциплина, которая в широком смысле разрабатывает методы сбора, систематизации, анализа и интерпретации, отображения результатов массовых случайных явлений и процессов с целью выявления существующих в них закономерностях.
Средняя квадратическая ошибка эксцесса исчисляется по формуле:
, где п – число наблюдений
Все перечисленные характеристики играют большую роль при анализе вариационных рядов и определении типа кривой распределения, а также при выравнивании вариационных рядов.
Вариация — это различия индивидуальных значений признака у единиц изучаемой совокупности. Исследование вариации имеет большое практическое значение и является необходимым звеном в экономическом анализе. Необходимость изучения вариации связана с тем, что средняя, являясь равнодействующей, выполняет свою основную задачу с разной степенью точности: чем меньше различия индивидуальных значений признака, подлежащих осреднению, тем однороднее совокупность, а, следовательно, точнее и надежнее средняя, и наоборот. Следовательно по степени вариации можно судить о границах вариации признака, однородности совокупности по данному признаку, типичности средней, взаимосвязи факторов, определяющих вариацию. Исследование вариации в статистике имеет важное значение, т.к. дает возможность оценить степень воздействия на данный признак других варьирующих признаков. Определение вариации необходимо при организации выборочного наблюдения, построения статистических моделей, разработке материалов экспертных опросов и т.д.
Изменение вариации признака в совокупности осуществляется с помощью абсолютных и относительных показателей.
Абсолютные показатели вариации включают: 1) размах вариации 2)среднее линейное отклонение 3)дисперсию
4) среднее квадратическое отклонение
Вариационный ряд – ряд, в котором сопоставлены (по степени возрастания или убывания)варианты и соответствующие им частоты
Варианты – отдельные количественные выражения признака. Обозначаются латинской буквой V. Классическое понимание термина "варианта" предполагает, что вариантой называется каждое уникальное значение признака, без учета количества повторов.
Частота – число, показывающее, сколько раз повторяется варианта. Обозначается латинской буквой P. Сумма всех частот (которая, разумеется, равна числу всех исследуемых) обозначается как n.
Виды вариационных рядов:
Вариационный ряд служит для описания больших массивов чисел, именно в этой форме изначально представляются собранные данные большинства медицинских исследований. Для того, чтобы охарактеризовать вариационный ряд, рассчитываются специальные показатели, в том числе средние величины, показатели вариабельности (так называемой, дисперсии), показатели репрезентативности выборочных данных.
Средняя арифметическая - это обобщающий показатель, характеризующий размер изучаемого признака. Средняя арифметическая обозначается как M, представляет собой самый распространенный вид средней. Средняя арифметическая рассчитывается как отношение суммы значений показателей всех единиц наблюдения к числу всех исследуемых. Методика расчета средней арифметической различается для простого и взвешенного вариационного ряда.
Формула для расчета простой средней арифметической: M = Σ(V)/ n
Формула для расчета взвешенной средней арифметической: M = Σ(V * P)/ n
Мода – еще одна средняя величина вариационного ряда, соответствующая наиболее часто повторяющейся варианте. Или, если выразиться по другому, это варианта, которой соответствует наибольшая частота. Обозначается как Мо. Мода рассчитывается только для взвешенных рядов, так как в простых рядах ни одна из вариант не повторяется и все частоты равны единице.
Медиана – значение варианты, делящей вариационный ряд пополам: по обе стороны от нее находится равное число вариант. Медиана также, как и средняя арифметическая и мода, относится к средним величинам. Обозначается как Me
4) Среднее квадратическое отклонение - мера вариабельности вариационного ряда. Является интегральным показателем, объединяющим все случаи отклонения вариант от средней. Фактически, отвечает на вопрос: насколько далеко и как часто варианты распространяются от средней арифметической. Обозначается греческой буквой σ ("сигма").
При численности совокупности более 30 единиц, стандартное отклонение рассчитывается по следующей формуле:
Для малых совокупностей - 30 единиц наблюдения и менее - стандартное отклонение рассчитывается по другой формуле:
Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратичное отклонение.
1. Самым распространенным
абсолютным показателем
2. Для обобщающей характеристики
распределения отклонений
- невзвешенное среднее линейное отклонение
- взвешенное среднее линейное отклонение
3. Меру вариации более
объективно отражает
- невзвешенная или - взвешенная
4. Корень квадратный из дисперсии s «среднего квадрата отклонений» представляет собой среднее квадратическое отклонение:
Среднее квадратическое отклонение (СКО) выражается в тех же единицах измерения, что и признак ( в литрах, тоннах, рублях, %-х и т.д.). СКО является мерилом надежности средней. Чем меньше СКО, тем лучше средняя арифметическая отражает собой представляющую совокупность.
К относительным показателям, позволяющим сравнивать характер рассеивания в различных распределениях, относятся следующие:
1)Коэффициент осциляции
– отражающий относительную
2)Относительное линейное
отклонение характеризует долю
усредненного значения абсолютн
Коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средней величины.
Дисперсия обладает рядом свойств, которые позволяют упростить ее расчеты.
1) Если из всех значений вариант отнять какое-то постоянное число А, то средний квадрат отклонений от этого не изменится:
2) Если все значения вариант разделить на какое-то постоянное число А, то средний квадрат отклонений уменьшится от этого в А² раз, а среднее квадратическое отклонение – в А раз.
3) Если исчислить средний квадрат отклонений от любой величины А, которая в той или иной степени отличается от средней арифметической х, то он всегда будет больше среднего квадрата отклонений s², исчисленный от средней арифметической:
А именно средний квадрат отклонений при этом будет больше на квадрат разности средней и этой условно взятой величиной, т.е. на : Или
Дисперсия от средней имеет свойство минимальности, т.е. она всегда меньше дисперсий, исчисленных от любых других величин. В этом случае, когда А приравнивается к нулю формула принимает вид:
или = -
Этот способ расчета дисперсии и среднего квадратического отклонения называется способом моментов, или способом от условного нуля. Он применяется при условии равных интервалов.
Используя второе свойство дисперсии, разделив, все варианты на величину интервала, получим: .
Выделяют общую, межгрупповую и внутригрупповую дисперсии.
Общая дисперсия характеризует вариацию признака, которая зависит от всех условий в данной совокупности:
, где - общая средняя для всей изучаемой совокупности
Межгрупповая дисперсия отражает вариацию изучаемого признака, которая возникает под влиянием признака-фактора, положенного в основу группировки. Она характеризует колеблемость групповых (частных) средних около общей средней : , где – средняя по отдельным группа, – общая средняя, - численность отдельных групп.
Средняя внутригрупповая дисперсия характеризует случайную вариацию в каждой группе. Эта вариация возникает под влиянием других неучитываемых факторов и не зависит от условия (признака-фактора), положенного в основу группировки:
Существует закон, связывающий три вида дисперсии (правило сложения дисперсий): общая дисперсия равна сумме средних из внутригрупповой и межгруповой дисперсии:
Вариация альтернативного признака заключается в наличии или отсутствии изучаемого свойства у единиц совокупности. Количественно вариация альтернативного признака выражается двумя значениями: наличие у единицы изучаемого свойства обозначается единицей (1), а его отсутствие — нулем (0). Долю единиц, обладающих изучаемым признаком, обозначают буквой , а долю единиц, не обладающих этим признаком — через . Учитывая, что p + q = 1 (отсюда q = 1 — p), а среднее значение альтернативного признака равно
,
средний квадрат отклонений
Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих данным свойством ( ), на долю единиц, данным свойством не обладающих ( ).
Процесс развития, движения социально-экономических явлений во времени в статистике принято называть динамикой. Для отображения динамики строят ряды динамики, которые представляют собой ряды изменяющихся во времени значений статистического показателя, расположенного в хронологическом порядке.
В каждом ряду динамики имеются два основных элемента:
1) период времени t (годы, кварталы, месяцы, сутки) или моменты времени;
2) уровни ряда (y).
Уровни рядов динамики отображают количественную оценку (меру) развития во времени изучаемого явления. Они могут выражаться абсолютными, относительными или средними величинами.
Существуют различные виды рядов динамики, которые можно классифицировать следующим образом.
1. По времени - моментные и интервальные.
Интервальный ряд динамики - это последовательность, в которой уровень явления относится к результату, накопленному или вновь произведенному за определенный интервал времени. (Например, ряд показателей объема продукции по месяцам года).
Если же уровень ряда показывает фактическое наличие изучаемого явления в конкретный момент времени, то совокупность уровней образует моментный ряд динамики.
Важное аналитическое отличие моментных рядов от интервальных состоит в том, что сумма уровней интервального ряда дает вполне реальный показатель – общий выпуск продукции за год, общие затраты рабочего времени, общий объем продаж и т.д., сумма же уровней моментного ряда реального содержания не имеет.
2. По форме представления уровней- ряды абсолютных. Относительных и средних величин.
3. По расстоянию между датами или интервалами времени выделяют полные и неполные хронологические ряды.
Полные ряды динамики имеют место, когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами. Неполные –когда принцип равных интервалов не соблюдается.
4. По числу показателей можно выделить изолированные и комплексные (многомерные) ряды динамики.
Если ведется анализ во времени одного показателя, имеем изолированный ряд динамики. Комплексный ряд динамики получаем в том случае, когда в хронологической последовательности дается система показателей, связанных между собой единством процесса или явления.
Правильное построение рядов динамики предполагает выполнение ряда требований:
Анализ скорости и интенсивности развития явления во времени осуществляется с помощью статистических показателей, которые получаются в результате сравнения уровней между собой. К таким показателям относят:
В случае, когда сравнение проводится с периодом (моментом) времени, начальным в ряду динамики, получают базисные показатели. Если же сравнение производится с предыдущим периодом или моментом времени, то говорят о цепных показателях.
Расчет показателей динамики
№ |
Показатель |
Базисный |
Цепной |
1. |
Абсолютный прирост ( Δiбаз; Δiцеп )* |
yi – yo |
yi – yi-1 |
2. |
Коэффициент роста (Кр)** |
yi : yo |
yi : yi-1 |
3. |
Темп роста (Тр) |
(yi : yo) · 100% |
(yi : yi-1) · 100% |
4. |
Коэффициент прироста (Кпр) |
Кр -1 (yi –yo)/yo; Δбаз : yo |
Кр -1 (yi –yi-1)/yi-1; Δцеп : (yi-1) |
5. |
Темп прироста (Тпр) |
Кпр · 100; Тр - 100 |
Кпр · 100; Тр – 100 |
6. |
Абсолютное значение одного %-та прироста (А) |
yi-1 : 100; (yi – yi-1) / (Тр –100); ∆ : Тпр |