Статистический анализ рядов распределения

Автор работы: Пользователь скрыл имя, 05 Ноября 2010 в 22:52, Не определен

Описание работы

Проверка гипотезы о законе распределения

Файлы: 1 файл

КП статистика.doc

— 2.53 Мб (Скачать файл)

Министерство  образования и науки Российской Федерации

Государственное образовательное учреждение высшего

профессионального образования

    «Санкт-Петербургский  государственный 

    политехнический университет» 

    Факультет экономики и менеджмента 

    Кафедра «Предпринимательство и коммерция» 
 
 
 
 

    КУРСОВОЙ ПРОЕКТ 

    по дисциплине «Статистика»

    на тему «Статистический анализ рядов распределения. Проверка гипотезы о законе распределения» 
 
 
 
 

    Выполнил____________

                                   (подпись) 
                       

    Принял: Магистр коммерции

    ____________

                                                                          (подпись)

    «__» _________ 2010 г. 
 
 
 
 
 
 
 

    Санкт-Петербург

    2010  
 

    ДАННЫЕ, ВАРИАЦИОННЫЙ РЯД, РАНЖИРОВАНИЕ, ВЫБРОСЫ, ГИСТОГРАММА, ПОЛИГОН, КУМУЛЯТА, ИНТЕРВАЛЬНЫЕ РЯДЫ , СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ, СГЛАЖИВАНИЕ ИМПЕРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ, ГИПОТЕЗА 
 
 

    В курсовом проекте рассмотрена реализация анализа распределений с использованием программы STATISTICA, а также произведены расчеты основных статистических показателей. 

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

    СОДЕРЖАНИЕ 

    Введение…………………………………………………………………стр.4

      1. Табличное и графическое представление вариационного ряда распределения………………………………………………………стр.5

      2. Расчет основных характеристик вариационного ряда………...стр.17

      3. Сглаживание эмпирического распределения, проверка гипотезы о законе распределения……………………………………………...стр.21

    Заключение………………………………………………...……………стр.25

    Список использованных источников…………………………………..стр.26 
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     

Введение

 

     Ряд распределения – это распределение  единиц совокупности по значению того или иного признака в конкретных условиях места и времени.

     Ряды  распределения могут быть вариационным, если они строятся на основе количественного  признака, или атрибутивным, если они  строятся на основе атрибутивного признака.

     Изучение  вариационных рядов распределения  позволяет: определить типический уровень  признака в изучаемой совокупности; определить наличие выбросов и решить вопрос о необходимости их самостоятельного изучения; оценить степень разброса значений признака вокруг типического уровня; изучить структуру совокупности; охарактеризовать форму распределения, а также подобрать теоретическое распределение, на основе которого можно моделировать поведение распределения изучаемой совокупности.

      На  основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д., с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований. Таким образом статистические ряды распределения являются базисным методом для любого статистического анализа. Понимание данного метода и навыки его использования необходимы для проведения статистических исследований.

     Ряды  распределения могут быть представлены в табличной форме и графически.

    Целью проекта является освоение методики и приобретение практических навыков анализа распределений, включающего расчет основных статистических характеристик, графическое и табличное представление рядов распределения.

      В курсовом проекте рассматривается реализация анализа распределений с использованием программы STATISTICA.

      STATISTICA – это универсальная интегрированная система, предназначенная для статистического анализа и визуализации данных, управления базами данных и разработки пользовательских приложений, содержащая широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе, а также специальные методы добычи данных. 
 
 
 
 
 

    1. Табличное и графическое представление

    вариационного ряда 

    Проект  выполнен на основе исследования данных о числе собственных легковых автомобилей на 1000 человек по различным округам, республикам, краям в 2001 году.

    Исходные  данные приведены в Табл. 1.1. 

    Табл.1.1

    Число собственных легковых автомобилей 

    на 1000 человек в 2001г.

Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей
1 147 16 122,2 31 46,6 46 110,1 61 158,6 76 115,4
2 62,1 17 100,3 32 56,4 47 118,5 62 132,3 77 114,1
3 112,8 18 197 33 96,6 48 68,3 63 112,5 78 120,2
4 172,9 19 166 34 118,3 49 107 64 81,7 79 115,1
5 93,8 20 115,7 35 104,9 50 97,9 65 94,1 80 187,7
6 121 21 92,7 36 115,6 51 112,8 66 166 81 134,6
7 105 22 69,7 37 34,4 52 150,8 67 126,1 82 150,7
8 114,7 23 121 38 172 53 107,5 68 120,5 83 197,7
9 132,7 24 216,9 39 136,8 54 165,4 69 50,4 84 19,6
10 183,4 25 141,4 40 119,3 55 129,5 70 10,8 85 173,1
11 119,8 26 149,7 41 131,2 56 122,8 71 140 86 196
12 119 27 106,2 42 142,8 57 122 72 34 87 124,9
13 107,4 28 127,7 43 134 58 104,3 73 117,4 88 20,8
14 135,4 29 168,1 44 86,7 59 180,4 74 94,8    
15 133,8 30 147,6 45 85,7 60 113,2 75 130,7    
 

     Построение  ряда распределения начинается с ранжирования ряда распределения по величине соответствующего признака. Ранжирование – это расположение единиц совокупности в порядке возрастания или убывания значений признака. Для этого выбираем в меню Data опцию Sort. Далее в поле Direction выбираем тип сортировки – по возрастанию значений признака (Ascending). Получим значения признака, упорядоченные по возрастанию   (см. Табл.1.2). Построение ранжированного ряда позволяет увидеть наличие в совокупности выбросов. Выбросы - значения признака, резко отличающиеся в меньшую или большую сторону от основной массы значений признака. 
 
 
 
 

     Табл. 1.2

Исходные  данные, ранжированные по возрастанию  значений признака 

Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей
1 10,8 16 93,8 31 112,8 46 120,2 61 133,8 76 166
2 19,6 17 94,1 32 112,8 47 120,5 62 134 77 166
3 20,8 18 94,8 33 113,2 48 121 63 134,6 78 168,1
4 34 19 96,6 34 114,1 49 121 64 135,4 79 172
5 34,4 20 97,9 35 114,7 50 122 65 136,8 80 172,9
6 46,6 21 100,3 36 115,1 51 122,2 66 140 81 173,1
7 50,4 22 104,3 37 115,4 52 122,8 67 141,4 82 180,4
8 56,4 23 104,9 38 115,6 53 124,9 68 142,8 83 183,4
9 62,1 24 105 39 115,7 54 126,1 69 147 84 187,7
10 68,3 25 106,2 40 117,4 55 127,7 70 147,6 85 196
11 69,7 26 107 41 118,3 56 129,5 71 149,7 86 197
12 81,7 27 107,4 42 118,5 57 130,7 72 150,7 87 197,7
13 85,7 28 107,5 43 119 58 131,2 73 150,8 88 216,9
14 86,7 29 110,1 44 119,3 59 132,3 74 158,6    
15 92,7 30 112,5 45 119,8 60 132,7 75 165,4    
 

       В данной совокупности выбросами являются значения регионов под номерами 1, 2, 3, 88, т.е. данные 10,8; 19,6; 20,8 и 216,9 резко отличаются от основной части значений признака. Поэтому при анализе совокупности в дальнейшем исключим эти значения признака. Каждое из них выделяется и стирается простым нажатием кнопки Delete на клавиатуре. Также удаление значений (выбросов) из ячеек, можно провести как удаление наблюдений, то есть строк. В итоге изучаемая совокупность будет состоять из 84 значений признака (см.Табл.1.3) . 

Табл.1.3

Исходные  данные за исключением выбросов,

 ранжированные  по возрастанию значений признака 

Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей Номер региона Число легковых автомобилей
1 34 16 96,6 31 114,1 46 121 61 135,4 76 172
2 34,4 17 97,9 32 114,7 47 122 62 136,8 77 172,9
3 46,6 18 100,3 33 115,1 48 122,2 63 140 78 173,1
4 50,4 19 104,3 34 115,4 49 122,8 64 141,4 79 180,4
5 56,4 20 104,9 35 115,6 50 124,9 65 142,8 80 183,4
6 62,1 21 105 36 115,7 51 126,1 66 147 81 187,7
7 68,3 22 106,2 37 117,4 52 127,7 67 147,6 82 196
8 69,7 23 107 38 118,3 53 129,5 68 149,7 83 197
9 81,7 24 107,4 39 118,5 54 130,7 69 150,7 84 197,7
10 85,7 25 107,5 40 119 55 131,2 70 150,8    
11 86,7 26 110,1 41 119,3 56 132,3 71 158,6    
12 92,7 27 112,5 42 119,8 57 132,7 72 165,4    
13 93,8 28 112,8 43 120,2 58 133,8 73 166    
14 94,1 29 112,8 44 120,5 59 134 74 166    
15 94,8 30 113,2 45 121 60 134,6 75 168,1    

Информация о работе Статистический анализ рядов распределения