Автор работы: Пользователь скрыл имя, 04 Марта 2010 в 19:15, Не определен
теория статистики, выбока и ее представления. формулы статистики
Напомним, что такое выборка, вариационный ряд, эмпирическое распределение, группирование, гистограмма, выборочные характеристики и др.
Выборкой х1, ..., хn объема n из совокупности, распределенной по F(х), называется n независимых наблюдений над случайной величиной x с функцией распределения F(x).
Вариационным рядом х(1)£ х(2)£ ... £ х(n) называется выборка, записанная в порядке возрастания ее элементов.
Каждому наблюдению из выборки присвоим вероятность, равную 1/n; получим распределение, которое называют эмпирическим; ему соответствует функция эмпирического распределения
где mn(х) - число членов выборки, меньших х. Значение этой функции для статистики определяется тем, что при n ® ¥
(теорема Гливенко).
Выборки
больших объемов
Числовые характеристики эмпирического распределения называются выборочными характеристиками: выборочные среднее (математическое ожидание), дисперсия:
выборочный момент порядка к:
mk =
выборочные квантили zp порядка р - корни уравнения
F(zp)=p,
которыми являются члены вариационного ряда
z(p)=x([np]+1),
где [nр] означает целую часть nр; частным случаем (p = 0.5) является выборочная медиана - центральный член вариационного ряда. Значение выборочных характеристик состоит в том, что при n ® ¥ они стремятся к истинным значениям распределения F(х).
Приведем с помощью пакетов примеры. Исходные данные находятся в табл.1 ( E(a) в таблице означает показательное (экспоненциальное) распределение с математическим ожиданием, равным a).
таблица1
¹ | Закон | n | a | ¹ | Закон | n | a |
1 | R [0, 2] | 50 | 0.03 | 14 | N (1,4) | 60 | 0.01 |
2 | N(2, 0.25) | 60 | 0.02 | 15 | E (5) | 70 | 0.03 |
3 | E (3) | 70 | 0.01 | 16 | R [0.3] | 80 | 0.1 |
4 | R [1, 3] | 80 | 0.02 | 17 | N (1,4) | 50 | 0.3 |
5 | N (1, 1) | 50 | 0.01 | 18 | E (1) | 60 | 0.2 |
6 | E (2) | 60 | 0.03 | 19 | R [1,3] | 70 | 0.03 |
7 | R [2, 3] | 70 | 0.01 | 20 | N (1,1) | 80 | 0.02 |
8 | N (0, 4) | 80 | 0.03 | 21 | E (2) | 50 | 0.01 |
9 | E (3) | 50 | 0.02 | 22 | R [2,3] | 60 | 0.02 |
10 | R [0, 2] | 60 | 0.03 | 23 | N (2,1) | 70 | 0.01 |
11 | N [2, 1] | 70 | 0.02 | 24 | E (3) | 80 | 0.03 |
12 | E (4) | 80 | 0.01 | 25 | R [1,2] | 50 | 0.01 |
13 | R [1, 2] | 50 | 0.02 |
Генерация выборки
Работа
начинается с главного меню пакета
(панель STATGRAPHICS Statistical Graphics System):
|STATGRAPHICS Statistical Graphics System|
DATA MANAGEMENT AND SYSTEM UTILITIES TIME SERIES PROCEDURES
A. Data Management
B. System Environment
C. Report Writer and Graphics Replay
D. Graphics Attributes
PLOTTING AND DESCRIPTIVE STATISTICS ADVANCED PROCEDURES
E. Plotting Functions
F. Descriptive Methods
G. Estimation and Testing
H. Distribution Functions
I. Exploratory Data Analysis
ANOVA
AND REGRESSION ANALYSIS
J. Analysis of Variance
K. Regression Analysis
Выполнение:
H.Distribution functions (законы распределения) — 5.Random Number Generation (генерация случайных чисел) - из списка Distributions available (возможные распределения) выбираем нужное и его номер вводим в окно Distribution number - F6 (исполнение) — вводим параметры распределения и объем выборки Number of samples; исходное состояние датчика случайных чисел (окно seed) оставим без изменения (однако, оно не должно превышать 2147483646) - F6 — вводим имя файла, в котором будем хранить все данные этой работы (в виде различных переменных): File: WORK (например), вводим имя переменной, в которой будет находиться наша выборка: Variable (переменная): x - F6.
Выборка сгенерирована. Посмотрим полученную выборку:
Ctrl + Break (быстрый возврат в главное меню вместо многократного Esc или F10) — A.Data Management (управление данными) — 1.Display Data Directory — выбираем нашу переменную WORK.x - F6.
Наблюдаем выборку. Выпишем значения выборки или выведем на печать (клавиша F4) или сохраним (F3; повторный вызов: Report Writer & Graphics Replay (составление отчетов и вызов графиков) - Replay Texts & Graphic Files (вызов текстов и графических файлов ) ).
Посмотрим выборку графически. После возврата в главное меню (Ctrl + Break):
E.Plotting Function (графические функции) — 1.X-Y Line and Scatterplots (x-y графики) — вводим данные для графика: по оси x должны быть целые числа от 1 до n: в строку x записываем оператор (для n = 50, например):
COUNT 50
этот оператор создает массив целых чисел от 1 до 50; в строку y записываем x; в окне Points: Yes (точки нужны), в окне Lines: Yes (клавишей «пробел», линии нужны) - F6.
График
выведем на печать (F4) или сохраним
(F3).
Построение вариационного ряда
1-й способ
A.2.File Operations — вводим в окно file name: WORK (можно так: Ctrl+F7 (список файлов) — выделить нужный - ENTER) - Desired operation: C (Edit - редактирование) - F6 — выделяем переменную x - ENTER - F6-(наблюдаем выборку) - F5 (опции) - Sort in ascending order (сортировка в порядке возрастания ) - F6 - Save and exit (запоминание и выход). Если бы требовалось не менять содержимое переменной x, следовало бы сначала скопировать ее в другую переменную (операцией Update).
2-й способ
Сначала загрузим оператор сортировки SORTUP, который относится к разряду загружаемых:
V.Supplementary Operations (дополнительные операции) — 1.Load Operation and Function (загрузка операторов и функций) — Mathematical function - Read (после использования загружаемых операторов их желательно выгрузить опцией Erase, чтобы не занимать память).
Ctrl+F5
(быстрый выход в исполнительное окно)
— SORTUP x - ENTER
(наблюдаем вариационный ряд, при этом
содержащие переменной x не изменилось).
Построение графика функции эмпирического распределения
F.3.Frequency Histogram — Data: x - F6 — поправляем некоторые параметры графика: No of classes (число классов): 200 (или еще больше: — 500, чтобы на каждый интервал попало не больше одного наблюдения), Cumulative: Yes, (накопленные частоты, т.е. функция распределения), Relative: Yes, (относительные частоты) - F6.
Наблюдаем
функцию эмпирического
Группирование данных
F.2.Frequency Tabulation — Data: x - F6 — поправляем, если нужно параметры группирования: нижний (Lower limit) и верхний (Upper Limit) пределы (минимальное и максимальное значения выборки приведены ниже на экране), число интервалов группирования No of classes: 10 - F6 — Display Table - ENTER.
Наблюдаем
таблицу группированных данных. Выводим
ее на печать или сохраняем.
Построение гистограммы частот
F.3.Frequency Tabulation — Data: x - F6 — поправляем параметры графика: No of classes: 10 - F6.
Наблюдаем
гистограмму. Выводим ее на печать или
сохраняем.