Описательные статистики

Автор работы: Пользователь скрыл имя, 11 Декабря 2010 в 14:50, реферат

Описание работы

В работе дается краткое описание методов применяемых в математической обработке данных

Содержание работы

Введение
1. Описательная статистика
2. Среднее (Мх)
3. Дисперсия (D)
4. Стандартное отклонение (σ)
5. Медиана (Ме)
6. Мода (Мо)
Заключение
Практическое задание
Список литературы

Файлы: 1 файл

Реферат описательные статистики.doc

— 164.00 Кб (Скачать файл)

     Медиана разбивает выборку на две равные части. Половина значений переменной лежит ниже медианы, половина — выше. Медиана дает общее представление о том, где сосредоточены значения переменной, иными словами, где находится ее центр. В некоторых случаях, например при описании доходов населения, медиана более удобна, чем среднее.

     Рассмотрим способы определения медианы при различных значениях N.  Для нахождения медианы измерения записывают в ряд по возрастанию значений. Если число измерений N нечетное, то медиана численно равна значению этого ряда, стоящему точно в середине, или на (N+1)/2 месте. Например, медиана пяти измерений: 10, 17, 21, 24, 25 – равна 21 – значению, стоящему на третьем месте (N+1)/2=(5+1)/2=3.

     Если  число измерений четное, то медиана  численно равна среднему арифметическому  значений ряда, стоящих в середине, или на N/2 и N/2+1 местах. Например, медиана восьми измерений: 5, 5, 6, 7, 8, 8, 9, 9 – равна 7,5 (7+8)/2=7,5 – среднему арифметическому значений ряда, стоящих на четвертом и пятом местах (N/2=8/2=4 и N/2+1=4+1=5). [4]

     Квартили  представляют собой значения, которые  делят две половины выборки (разбитые медианой) еще раз пополам (от слова кварта — четверть).

     Различают верхнюю квартиль, которая больше медианы и делит пополам верхнюю  часть выборки (значения переменной больше медианы), и нижнюю квартиль, которая меньше медианы и делит пополам нижнюю часть выборки.

     Нижнюю  квартиль часто обозначают символом 25%, это означает, что 25% значений переменной меньше нижней квартили.

     Верхнюю квартиль часто обозначают символом 75%, это означает, что 75% значений переменной меньше верхней квартили.

     Таким образом, три точки — нижняя квартиль, медиана и верхняя квартиль - делят  выборку на 4 равные части.

     ¼ наблюдений лежит между минимальным  значением и нижней квартилью, ¼ - между нижней квартилью и медианой, ¼ - между медианой и верхней квартилью, ¼ - между верхней квартилью и максимальным значением выборки. [3]

 

      6. Мода (Мо) 

     Мода (англ. mode) представляет собой наиболее часто встречающееся значение переменной (иными словами, наиболее «модное» значение переменной). Сложность состоит в  том, что редкая выборка имеет единственную моду. Если в выборке несколько мод, то говорят, что она мультимодальна или многомодальна (имеет два или более «пика»). Таким образом можно сказать, что мода характеризует не только положение выборки, но отчасти и форму ее распределения.

     Мода  представляет собой максимально  часто встречающееся значение переменной (иными словами, наиболее «модное» значение переменной), например, популярная передача на телевидении, модный цвет платья или  марка автомобиля и т. д, Сложность в том, что редкая совокупность имеет единственную моду. (Например: 2, 6, 6, 8, 9, 9, 9, 10 – мода = 9).

     Если  распределение имеет несколько  мод, то говорят, что оно мультимодально или многомодально (имеет два  или более «пика»). [1]

     Ассиметрия  – это свойство распределения выборки, которое характеризует несимметричность распределения СВ. На практике симметричные распределения встречаются редко и чтобы выявить и оценить степень асимметрии, вводят следующую меру:

       

     Асимметрия  бывает положительной и отрицательной. Положительная сдвигается влево, а отрицательная – вправо. [5]

              Эксцесс – это мера крутости  кривой распределения.

                 Эксцесс равен:

     

     Кривая  распределения может быть островершинной, плосковершинной, средне вершинной. Эти  четыре момента составляют набор особенностей распределения при анализе данных. Для нормального распределения А=0, Е=0. [5]

 

Заключение 
 

     Описательные  статистики дают нам возможность  оценить характер распределения  данных в изучаемой выборке. На основании  этой оценки мы можем принять решение о том, какие критерии надлежит использовать в дальнейшей работе – например, при сравнении выборок. Описательные статистики являются основой построения статистических графиков и диаграмм – например, диаграмм размаха, т.е. являются предварительным этапом в проведении визуального анализа данных. Таким образом, можно отнести их к категории разведочных методов анализа данных.

 

      Практическое задание 

     Провести  кластерный анализ качеств личности

      Agglomeration Schedule 

Stage Cluster Combined Coefficients Stage Cluster First Appears Next Stage

 

Cluster 1

Cluster 2

 

Cluster 1

Cluster 2

 

1

2 6 ,000 0 0 5
2 4 5 ,000 0 0 3
3 1 4 ,000 0 2 4
4 1 3 ,000 3 0 5
5 1 2 1,000 4 1 0
 

      Vertical Icicle 

Number of clusters Case

 

Интеллегентный

   Интелект    Ответственный    Отзывчивый    Веселый    Добрый
1 X X X X X X X X X X X
2 X X X    X X X X X X X
3 X X X    X    X X X X X
4 X X X    X    X X X    X
5 X X X    X    X    X    X
 
 

 

           Кластерный анализ применяется, чтобы облегчить задачу классификации людей по большому количеству признаков.

     Используем метод древовидной классификации. Метод древовидной классификации – это пошаговый метод разбиения выборки на отдельные группы. Анализ полученных данных позволил нам разделить выборку на два кластера. В первый вошли такие качества как интеллект, интеллигентность.

     Второй  кластер составили качества: веселый, добрый, отзывчивый, ответственный. 

 

      Список литературы 

  1. Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. Пособие для вузов/В.Е. Гмурман. – 9-е изд., стер. – М.:Высш. шк., 2003. – 188 с.
  2. Годфруа Ж. Что такое психология. — М., 1992. – 288с
  3. Оценка качества подготовки будущих учителей. – Тула: Изд-во Тул. гос. пед. ун-та, 2002. – 140 с.
  4. Наследов А. Д. Математические методы психологического исследования. Анализ и интерпретация данных. - СПб.: Речь,  2004 – 392с.
  5. Сидоренко Е. В. Методы математической обработки в психологии. -СПб., 2001 – 350 с.

Информация о работе Описательные статистики