Описательные статистики

Автор работы: Пользователь скрыл имя, 11 Декабря 2010 в 14:50, реферат

Описание работы

В работе дается краткое описание методов применяемых в математической обработке данных

Содержание работы

Введение
1. Описательная статистика
2. Среднее (Мх)
3. Дисперсия (D)
4. Стандартное отклонение (σ)
5. Медиана (Ме)
6. Мода (Мо)
Заключение
Практическое задание
Список литературы

Файлы: 1 файл

Реферат описательные статистики.doc

— 164.00 Кб (Скачать файл)

     Описательные  статистики 

     Содержание 

     Введение……………………………………………………………………3

     1. Описательная статистика……………………………………………….5

     2. Среднее (Мх)…………………………………………………………….7

     3. Дисперсия (D)…………………………………………………………..10

     4. Стандартное отклонение (σ)…………………………………………..11

     5. Медиана (Ме)…………………………………………………………..12

     6. Мода (Мо)……………………………………………………………....14

     Заключение………………………………………………………………..16

     Практическое  задание…………………………………………………….17

     Список  литературы……………………………………………………….19 
 
 
 

 

      Введение 

     Окружающий  нас мир насыщен информацией – разнообразные потоки данных окружают нас, захватывая в поле своего действия, лишая правильного восприятия действительности. Не будет преувеличением сказать, что информация становится частью действительности и нашего сознания.

     Без адекватных технологий анализа информации (данных) человек оказывается беспомощным в жестокой информационной среде. Статистика позволяет компактно описать данные, понять их структуру, провести классификацию, увидеть закономерности в хаосе случайных явлений.

     Широкому  внедрению методов анализа данных в 60-х и 70-х годах нашего века немало способствовало появление компьютеров, а начиная с 80-х годов — персональных компьютеров. Статистические программные пакеты сделали методы анализа данных более доступными и наглядными. Теперь уже не требуется вручную выполнять трудоемкие расчеты по сложным формулам, строить вручную сложные диаграммы и графики — всю эту черновую работу взял на себя компьютер, а исследователю осталась главным образом творческая работа: постановка задач исследования, выбор методов психологического исследования и грамотная интерпретация результатов. [1]

     Математическая  статистика исходит из предположения, что наблюдаемая изменчивость окружающего  мира имеет два источника:

     - действие известных причин и факторов. Они порождают изменчивость, закономерно объяснимую.

     - действие случайных причин и  факторов. Большинство природных  и общественных явлений обнаруживают  изменчивость, которая не может  быть целиком объяснена закономерными  причинами. В таком случае прибегают  к концепции случайной изменчивости. Выражение «случайный» в данном контексте означает «подчиняющийся законам теории вероятности».

     Статистический  подход – это выявление закономерной изменчивости на фоне случайных факторов и причин. Методы математической статистики позволяют оценить параметры имеющихся закономерностей, проверить те или иные гипотезы об этих закономерностях. [1]

     Целью работы является изучение описательных статистик.

     Задачи:

  1. Изучить предназначение описательной статистики;
  2. Раскрыть сущность таких описательных статистик как мода, медиана, среднее значение, дисперсия, стандартное отклонение.

     Аппарат математической статистики является изумительным по мощности и гибкости инструментом для отсеивания закономерностей  от случайностей. Психологу-исследователю обязательно необходимо накапливать информацию об окружающем мире, пытаясь выделить закономерности из случайностей. 

 

      1. Описательная статистика  

     Первый  раздел математической статистики –  описательная статистика – предназначен для представления данных в удобном виде и описания информации в терминах математической статистики и теории вероятностей.

     Основной  величиной в статистических измерениях является единица статистической совокупности (например, любой из критериев оценки качества педагога-исследователя). Единица статистической совокупности характеризуется набором признаков или параметров. Значения каждого параметра или признака могут быть различными и в целом образовывать ряд случайных значений x1, х2, …, хn. [3]

     Переменная (variable) -  это параметр измерения, который можно контролировать или которым можно манипулировать в исследовании. Так как значения переменных не постоянны, нужно научиться описывать их изменчивость.

     Для этого придуманы описательные или  дескриптивные статистики: минимум, максимум, среднее, дисперсия, стандартное отклонение, медиана, квартили, мода.

     Относительное значение параметра - это отношение  числа объектов, имеющих этот показатель, к величине выборки. Выражается относительным  числом или в процентах (процентное значение).

     Пример: Успеваемость в классе = числу положительных итоговых отметок, деленному на число всех учащихся класса. Умножение этого значения на 100 дает успеваемость в процентах. 25/100=25%

     Удельное  значение данного признака - это  расчетная величина, показывающая количество объектов с данным показателем, которое содержалось бы в условной выборке, состоящей из 10, или 100, 1000 и т. д. объектов.

     Пример. Для сравнения уровня правонарушений в разных регионах берется удельная величина - количество правонарушений на 1000 человек (N) [3]

     Минимум и максимум — это минимальное  и максимальное значения переменной.

 

      2. Среднее (Мх) 

     Исходным  пунктом становления теории средних  величин явилось исследование пропорций  школой Пифагора. При этом не проводилось  строгого различия между понятиями средней величины и пропорции. Значительный толчок развитию теории пропорций с арифметической точки зрения был дан греческими математиками – Никомахом Герасским (конец I – начало II в. н.э.) и Паппом Александрийским (III в. н.э.). Первым этапом развития понятия средней является этап, когда средняя стала считаться центральным членом непрерывной пропорции. Но понятие средней как центрального значения прогрессии не дает возможности вывести понятие средней по отношению к последовательности n членов, независимо от того, в каком порядке они следуют друг за другом. Для этой цели необходимо прибегнуть к формальному обобщению средних. Следующий этап – переход от непрерывных пропорций к прогрессиям – арифметической, геометрической и гармонической. [1]

     В истории статистики впервые широкое употребление средних величин связано с именем английского ученого У. Петти. У. Петти один из первых пытался придать средней величине статистический смысл, связав ее с экономическими категориями. Но описания понятия средней величины, его выделения Петти не произвел. Родоначальником теории средних величин принято считать А. Кетле. Он одним из первых начал последовательно разрабатывать теорию средних величин, пытаясь подвести под нее математическую базу. А. Кетле выделял два вида средних величин – собственно средние и средние арифметические. Собственно средние представляют вещь, число, действительно существующие. Собственно средние или средние статистические должны выводиться из явлений однокачественных, одинаковых по своему внутреннему значению. Средние арифметические – числа, дающие возможно близкое представление о многих числах, различных, хотя и однородных. [2]

     Каждый  из видов средней может выступать  либо в форме простой, либо в форме  взвешенной средней. Правильность выбора формы средней вытекает из материальной природы объекта исследования. Формулы простых средних применяются в случае, если индивидуальные значения усредняемого признака не повторяются. Когда в практических исследованиях отдельные значения изучаемого признака встречаются несколько раз у единиц исследуемой совокупности, тогда частота повторений индивидуальных значений признака присутствует в расчетных формулах степенных средних. В этом случае они называются формулами взвешенных средних.

     Иерархия  средних значений:

     среднее значение функции — понятие, определяемое многими способами.

     Более конкретно, но на основе произвольных функций, определяются средние Колмогорова  для набора чисел.

     среднее степенное — частный случай средних  Колмогорова при φ(x) = xα. Средние  различных степеней связывает между собой неравенство о средних. Наиболее распространённые частные случаи:

     среднее арифметическое (α = 1);

     среднее квадратическое (α = 2);

     среднее гармоническое (α = − 1);

     по  непрерывности при  доопределяется среднее геометрическое, которое также является Колмогоровским средним при φ(x) = logx

     среднее взвешенное — обобщение средней  величины на случай произвольной линейной комбинации.

     среднее хронологическое — обобщает значения признака для одной и той же единицы или совокупности в целом, изменяющихся во времени.

     среднее логарифмическое, определяемое по формуле  ā=(a1-a2)/ln(a1/a2), используется в теплотехнике 

     Среднее (оценка среднего, выборочное среднее) — сумма значений переменной, деленная на n (число значений переменной). Если вы имеете значения Х(1), ..., X(N), то формула  для выборочного среднего имеет  вид:

     `х  =    

     Пример: Наблюдение посещаемости четырех внеклассных мероприятий в экспериментальном (20 учащихся) и контрольном (30) классах дали значения (соответственно): 18, 20, 20, 18 и 15, 23, 10, 28. Среднее значение посещаемости в обоих классах получается одинаковое - 19. Однако видно, что в контрольном классе этот показатель подчинен воздействию каких-то специфических факторов. [5]

     Выборочное  среднее является той точкой, сумма  отклонений наблюдений от которой равна 0. Формально это записывается следующим  образом:

     (`х  - х1) + (`х  - х2) + ... + (`х  - хn) =0

     Для оценки степени разброса (отклонения) какого-то показателя от его среднего значения, наряду с максимальным и  минимальным значениями, используются понятия дисперсии и стандартного отклонения. [5]

 

      3. Дисперсия (D) 

     Дисперсия выборки или выборочная дисперсия (от английского variance) – это мера изменчивости переменной. Термин впервые введен  Фишером в 1918 году. Выборочная дисперсия вычисляется по формуле:  

     s2 =     

     где `х  — выборочное среднее,

     N — число наблюдений в выборке. 

     Дисперсия меняется от нуля до бесконечности. Крайнее значение 0 означает отсутствие изменчивости, когда значения переменной постоянны. [4]

 

      4. Стандартное отклонение (σ)

      

     Стандартное отклонение, среднее квадратическое отклонение (от английского standard deviation) вычисляется как корень квадратный из дисперсии. Чем выше дисперсия или стандартное отклонение, тем сильнее разбросаны значения переменной относительно среднего.  

       

     Пример: Для предыдущего случая имеем 

     Классы                  
     Экспериментальный            19      1      1
     контрольный      19      48,5      8
 

     Это означает, что в одном классе посещаемость высокая, стабильная, а в другом - отличается непостоянством. [3]

 

5. Медиана (Ме) 
 

     Медианой (англ. median) называется значение исследуемого признака, справа и слева от которого находится одинаковое число упорядоченных элементов выборки. Если объем выборки – четное число, то медианой является среднее арифметическое двух центральных членов. Другими словами медиана разбивает выборку на две равные части. Также, как и среднее арифметическое, медиана дает общее представление о том, где находится центр выборки. В некоторых случаях медиана более удобна, чем среднее. Определение медианы было впервые использовано Гальтоном в 1882 г. [2]

Информация о работе Описательные статистики