Определение с помощью многократного измерения наиболее эффективной оценки характеристики положения закона распределения вероятности,

Автор работы: Пользователь скрыл имя, 31 Мая 2013 в 04:05, курсовая работа

Описание работы

Цель данной работы заключается в определении с помощью многократного измерения наиболее эффективной оценки характеристики положения закона распределения вероятности идентифицируемой со значением измеряемое безразмерной величины.
В данной курсовой работе стоит задача:
- привести общие сведения о характере положения закона распределения вероятности и их оценки;
- охарактеризовать возможные теоретические виды распределения вероятности;
- проанализировать способы определения аналитического выражения функции плотности распределения вероятности.

Содержание работы

Введение 4
1. Определение оценок основных характеристик 7
1.1. Среднее арифметическое 8
1.2. Исключение из массива промахов 11
2. Определение закона распределения 14
2.1. Построение гистограммы 14
2.2. Определение аналитического выражения функции плотности распределения вероятности 18
3. Проверка гипотезы 20
4. Определение результата измерений 22
Заключение 23
Список литературы 25

Файлы: 1 файл

20.09.12 курсовая.doc

— 854.00 Кб (Скачать файл)

 

 

Подставив значения в данные формулы, получили:

= 0,000083;

0,000048;

=  1,73;

Эксцесс распределения  для разных законов может иметь  значения от 1 до 3. 

Для удобства находят  и применяют в расчетах оценку контрэксцесса  , изменяющуюся от 0 до 1 и определяемую по формуле

     .                                                  (8)

Рассчитав, получили =0,76. [8]

 

1.2 Исключение из массива промахов

Качество средств  и результатов измерений характеризуются  наличием их погрешностей. Причинами  возникновения этих погрешностей являются: несовершенство методов измерений, средств измерений и причины, связанные с влиянием условий проведения измерений.

Грубые погрешности (промахи) – это погрешность результата отдельного измерения, входящего в  ряд измерений, которая для данных условий резко отличается от остальных  результатов этого яда. Источниками грубых погрешностей нередко бывают ошибки, допущенные оператором во время измерений [7].

Выявление грубых погрешностей осуществляют с помощью  разнообразных критериев (критерий Романовского, «трех сигм» и др.).

Так как критерий Романовского применяется, если число измерений n < 20, а в нашем случае их 200. Критерий «трех сигм» применяется для результатов измерений, распределенных по нормальному закону, а закон распределения нам еще не известен, поэтому воспользуемся неравенством Чебышева, которое устанавливает нижнюю границу вероятности того, что ни при каком законе распределения вероятности случайное значение результата измерения не отличается от среднего значения более, чем наполовину доверительного интервала, определяемого по формуле:

                                (9)

Отсюда могут  быть найдены значения t для заданной вероятности

                                 (10)

И границы доверительного интервала

                                          (11)

Доверительный интервал – это интервал, построенный  с помощью случайной выборки  из распределения с неизвестными параметрами, такой, что он содержит данный параметр с заданной вероятностью.

Однако в  указанном виде неравенство Чебышева не позволяет учесть особенности конкретного ЗРВ экспериментальных данных, по этой причине границы доверительной вероятности чрезвычайно широкие (для Р = 0,95 t < 4,47, а для нормального закона распределения вероятности, например, t = 2 при Р = 0,95), что в некоторых случаях может привести к искажению исходного закона распределения вероятности результата измерения, так как будут учитываться в нем сомнительные отсчеты. Можно уменьшить доверительную вероятность и получить более узкий доверительный интервал, но в этом случае уменьшенное значение доверительной вероятности не должно увеличиваться в дальнейших расчетах, что может создать дополнительные трудности с обработкой данных и представлением результата многократного измерения. Поэтому для учета ЗРВ при определении границ доверительной вероятности целесообразно использовать неравенство, определенное с помощью четвертого центрального момента

                              (12)

Где отношение  является оценкой эксцесса. Параметр t в этом случае определяется следующим выражением:

                               (13)

После расчета  параметра t для выбранной доверительной вероятности верхняя и нижняя границы предельных значений отсчетов определяются выражениями

;                                (14)

Отсчеты считаются промахами и должны быть исключены из массива данных. Рассчитаем t для Р = 0,95, получаем:

t = ( 0,000083 / (0,083158)4 (1-0,95))1/4 = 2,387895

Рассчитав значение параметра t для выбранной доверительной вероятности верхняя и нижняя границы предельных значений отсчетов определяются выражениями (14). Откуда получили значение нижней границы, равной -0,157188976 и значение верхней границы, равной 0,24643. После сравнения всех значений оказалось, что все значения попадают в данный интервал [7].

 

2 Определение закона распределения

2.1 Построение гистограммы

Графические методы сводятся к построению гистограммы  и полигона. Для этого проводят вспомогательные вычисления.

Для выполнения построения гистограммы предполагается два варианта выбора числа интервалов:

    1. Число интервалов находится между минимальным и минимальным числами, которые определяются по формулам

mmin = 0,55 n0,4                                         mmax = 1,25 n0,4

где n – число отсчетов,

    1. Число интервалов может быть выбрано из таблицы

 

Расчет числа  интервалов    Таблица 2.1

Число отсчетов

Рекомендуемое число интервалов

40 – 100

7 – 9

101 – 500

8 – 12

501 -1000

10 – 16

1001 – 10000

12-22


 

Определим количество интервалов по формулам. Получаем, что  минимальное число интервалов 5, а максимальное 11. По таблице рекомендуемое число интервалов от 8 до 12. Так как закон распределения плотности вероятности симметричный, то количество интервалов должно быть нечетным числом. Используя программу  Microsoft Excel, построим несколько гистограмм (для 7, 9 и 11 интервалов) [5].

 

 

Границы интервалов     Таблица 2.2

Кол-во отсчетов

Кол-во отсчетов

Кол-во отсчетов

1

2

3

4

5

6

-0,14

6

-0,14

2

-0,14

1

-0,09

38

-0,09625

24

-0,105

16

-0,04

55

-0,0525

62

-0,07

32

0,01

29

-0,0875

32

-0,035

43

0,06

44

0,035

17

0

28

0,11

50

0,07875

52

0,035

15

0,16

18

0,1225

36

0,07

31

0,21

0

0,16625

15

0,105

37

   

0,21

0

0,14

30

       

0,175

7

       

0,21

0

           

Рис. 2.1 Линейчатая диаграмма 7 интервалов по ячейкам 1-2 таблицы 2.2


Рис. 2.2 Линейчатая диаграмма 9 интервалов по ячейкам 3-4 таблицы 2.2

Рис. 2.3 Линейчатая диаграмма 11 интервалов по ячейкам 4-6 таблицы 2.2

На основании  гистограмм можно сделать предварительный вывод о том, что в данном ЗРВ две моды.  При этом оценки эксцесса и контрэксцесса свидетельствуют о том, что ЗРВ ближе к равномерному и двухмодальному распределению, чем к одномодальному. Именно поэтому для построения гистограмм целесообразно увеличить количество интервалов, например до 16.

Рис. 2.4 Линейчатая диаграмма 16 значений

Кроме гистограммы  целесообразно строить полигон  распределения значений. Построение полигона, который более наглядно, чем гистограмма, отражает форму распределения, производится путем соединения прямыми середин верхних оснований каждого столбца гистограммы. За пределами гистограммы, как слева, так и справа следуют пустые интервалы, в которых точки, соответствующие их серединам, лежат на оси абсцисс. Все эти точки при построении полигона и соединяются между собой отрезками прямых линий, образуя совместно с осью х замкнутую фигуру, площадь которой в соответствии с правилом нормирования должна быть равна единице [5].

Полученный  полигон распределений имеет  вид:

Рис. 2.5 Полигон  распределений

 

2.2 Определение аналитического выражения функции плотности распределения вероятности

По внешнему виду гистограммы и полигона выдвигают  гипотезу о виде закона распределения. Случайная величина наиболее полно  описывается аналитической кривой плотности распределения, потому идентификация формы распределения сводится к выбору аналитической модели.

Для определения  аналитического выражения аппроксимирующей функции плотности распределения  вероятности необходимо сгладить полученный на основе гистограммы полигон распределений, представив его в виде более плавной кривой, после чего сравнить полученную экспериментальную кривую с теоретическими кривыми плотностей распределения вероятности различных законов [2].

При выборе аппроксимирующей функции плотности распределения необходимо учитывать, что:

- в связи  с тем, что некоторые распределения  по внешнему виду похожи друг  на друга, целесообразно для  дальнейшего анализа выбрать  не одну аппроксимирующую функцию,  а 2 или более;

- аналитические выражения аппроксимирующих функций могут быть в виде прямых, экспонент и других функций.

По виду полученной гистограммы предположим, что закон  распределения двухмодальный. Построив с помощью программы Microsoft Excel кривую двухмодального распределения и наложив на полигон распределений, получаем:

Рис. 2.6 Экспериментально найденный полигон частотной гистограммы и аналитически найденный полигон

Из рисунка  следует, что отличия теоретической  зависимости от экспериментальной  незначительно. Функция распределения вероятности является интегральной функцией, значит, все выпуклые части кумулятивной кривой могут обозначать экстремумы гистограммы.

Хорошо наблюдаются  две выпуклости, которые указывают  на двухмодальность закона распределения  вероятности. Таким образом, скорее всего исходный массив представляет собой двухмодальный закон распределения вероятности [2].

 

3 Проверка гипотезы

Критерий  Пирсона

В качестве способа  оценки близости распределения выборки  экспериментальных данных к принятой аналитической модели закона распределения используются критерии согласия. Известен целый ряд критериев согласия. Наибольшее распространение в практике получил критерий Пирсона. Идея этого метода состоит в контроле отклонений гистограммы экспериментальных данных от гистограммы с таким же числом интервалов, построенных на основе распределения, совпадение с которым определяется. Использование критерия Пирсона возможно при большом числе измерений (n>50) и заключается в вычислении величины (хи-квадрат):

          ,                            (15)

где - экспериментальные и теоретические значения частот в i – ом интервале разбиения; m – число интервалов разбиения; - значения вероятностей в том же интервале разбиения, соответствующие выбранной модели распределения

                                                                  (16)

Если вычисленные  по опытным данным меры расхождения меньше определенного из таблицы значения q то гипотеза о совпадении экспериментального и выбранного теоретического распределений принимается.

Если же выходит за границы доверительного интервала, то гипотеза отвергается, как противоречащая опытным данным. Определяем , получаем:

= 8,8

Из таблицы  для распределения  (приложение А) я нашел, что для уровня значимости q=95%, = 9,4

Получили  < . Следовательно, гипотеза о совпадении экспериментального и выбранного теоретического распределений подтверждается [3].

 

4 Определение результата измерений

Определим оценки характеристики положения :

Оценка медианы

Оценка центра размаха

Оценка центра сгибов

Округление значения медианы

Информация о работе Определение с помощью многократного измерения наиболее эффективной оценки характеристики положения закона распределения вероятности,