Автор работы: Пользователь скрыл имя, 07 Февраля 2011 в 07:05, курсовая работа
Наряду с контролем продукции нередко требуется провести контроль параметров технологических процессов. Эта задача может быть решена путем проверки статистических гипотез. Однако, наибольшего эффекта, можно добиться не контролем параметров качества, а такой организацией производственных процессов, при которой брак продукции не производится.
Поэтому целью данной курсовой работы является ознакомление с основными этапами планирования эксперимента и применение их на практике для определения вида распределения генеральной совокупности и определения ее основных параметров, а также для проведения регрессионного анализа.
Введение 4
1 Эксперимент по определению характеристик случайной величины 5
1.1 Предварительный анализ данных 5
1.2 Определение вида распределения 6
1.2.1 Построение гистограммы 6
1.2.2 Формулировка проверяемой гипотезы 8
1.2.3 Проверка гипотезы о нормальности распределения с помощью графического метода 9
1.2.4 Критерий Колмогорова-Смирнова, модифицированный для проверки нормальности распределения 11
1.3 Получение точечных и интервальных оценок параметров распределения 12
1.3.1 Сущность задачи точечного и интервального оценивания параметров 12
1.3.2 Точечные оценки параметров распределения 13
1.3.3 Определение объема выборки для получения оценок с заданной точностью 14
1.3.4 Интервальная оценка математического ожидания 15
1.3.5 Проверка гипотезы о равенстве математического ожидания заданному значению 16
1.3.6 Интервальная оценка дисперсии 17
1.3.7 Проверка гипотезы о равенстве дисперсии заданному значению 18
1.4 Построение графиков функции плотности распределения, графиков эмпирической и теоретической функций распределения 19
1.4.1 Функция плотности распределения 19
1.4.2 Теоретическая функция распределения 20
1.4.3 Эмпирическая функция распределения 21
2 План эксперимента по выяснению регрессионной зависимости 22
Заключение 32
Список использованной литературы 33
Приложение А 34
Приложение Б
Согласно
полученной гистограмме можно
1.2.2 Формулировка проверяемой гипотезы
Сформулируем нулевую гипотезу:
Н0: Выборка из генеральной совокупности распределена по нормальному закону.
Альтернативная гипотеза
Н1: Выборка из генеральной совокупности распределена по закону, отличному от нормального.
Как известно, нормальное распределение (распределение Гаусса) - распределение вероятностей случайной величины Х, характеризуемой плотностью вероятности [1]. Теоретической основой нормального закона распределения вероятностей является центральная предельная теорема Ляпунова, утверждающая, что распределение суммы независимых случайных величин с любым исходным распределением будет нормальным, если число слагаемых достаточно велико, а вклад каждого в сумму мал.
Согласно [1] нормальное распределение симметрично относительно точки х = μ и имеет два параметра μ=0 и σ=1, совпадающих со средним значением и стандартным отклонением. Параметр μ характеризует положение μ на оси х, а параметр σ определяет степень рассеяния случайной величины относительно μ.
1.2.3 Проверка гипотезы о нормальности распределения с помощью графического метода
Данный метод основан на построении кумулятивной функции распределения наблюденных значений на бумаге для нормальных вероятностных графиков. Вертикальная ось имеет нелинейную шкалу, соответствующую площади под стандартной функцией нормального распределения и размечена значениями кумулятивной относительной частоты (в %). Другая ось имеет линейную шкалу для упорядоченных значений х. Если кумулятивная функция распределения переменной Х приближается к прямой линии, то распределение переменной Х будет нормальным [2].
Этот подход важен тем, что дает наглядную информацию по типу отклонения от нормального распределения. Чем больше объем выборки, тем более надежны заключения, которые можно вывести из вида графика функции распределения. Именно поэтому мною был выбран этот метод.
Графическая
процедура состоит в
на бумагу для нормальных вероятностных графиков (где k - порядковый номер х; k=1,…, n).
По данным выборки построим вариационный ряд, рассчитаем значения кумулятивной относительной частоты (в %) и заполним таблицу 1.
Таблица 1 – Данные для построения кумулятивной функции распределения
k | xk | P, % |
1 | -12,141 | 0,124938 |
2 | -11,405 | 0,324838 |
3 | -10,759 | 0,524738 |
4 | -10,361 | 0,724638 |
5 | -9,91 | 0,924538 |
… | … | … |
496 | 12,774 | 99,07546 |
497 | 13,832 | 99,27536 |
498 | 13,981 | 99,47526 |
499 | 14,237 | 99,67516 |
500 | 14,732 | 99,87506 |
По рассчитанным значениям построим график кумулятивной функции распределения заданной выборки:
Рисунок 3 – Кумулятивная функция распределения
Построенный график представлен набором точек, которые рассеяны около прямой линии - это дает первое подтверждение гипотезе о нормальном распределении генеральной совокупности, из которой взята выборка. Следует также отметить, что в данном случае частотное распределение имеет большую кривизну (график более выпуклый), но это не опровергает гипотезу Н0. Можно сделать вывод, что гипотеза о нормальном распределении для выборки наблюдений адекватна.
К
сожалению, использование только одного
критерия для проверки гипотезы о
виде распределения не может быть
до конца объективным. Поэтому рассмотрим
еще один критерий – Колмогорова-Смирнова,
модифицированный для проверки нормальности
распределения.
1.2.4 Критерий Колмогорова-Смирнова, модифицирован-ный для проверки нормальности распределения
Данный критерий основан на общем критерии Колмогорова-Смирнова и его применение в нашем эксперименте возможно, так как теоретическая функция распределения неизвестна нам с точностью до параметров μ и σ (они будут оцениваться по выборке). Алгоритм проверки гипотезы Н0 аналогичен алгоритму общего критерия, в данном случае меняются только критические значения - используется модифицированная статистика, рассчитываемая по формуле (3):
(3)
критические значения которой (α - уровень значимости) приведены в таблице 2.
Таблица 2 – Критические значения статистики Колмогорова-Смирнова, модифицированной для проверки нормальности распределения
По формулам (4), (5) находим среднее значение и стандартное отклонение для заданной выборки:
(4), (5)
= 2,006742, S = 4,8843.
Тогда zi = . Результаты расчетов сведем в таблицу 3.
Таблица 3 - Результаты расчетов модифицированного критерия Колмогорова - Смирнова
i | xi | zi | Ф(zi) | - Ф(zi) | Ф(zi) – | ||
1 | -12,141 | -2,89656 | 0,001886 | 0,002 | 0 | 0,000114 | 0,001886 |
2 | -11,405 | -2,74588 | 0,003017 | 0,004 | 0,002 | 0,000983 | 0,001017 |
3 | -10,759 | -2,61362 | 0,004479 | 0,006 | 0,004 | 0,001521 | 0,000479 |
4 | -10,361 | -2,53213 | 0,005669 | 0,008 | 0,006 | 0,002331 | -0,00033 |
5 | -9,91 | -2,4398 | 0,007348 | 0,01 | 0,008 | 0,002652 | -0,00065 |
6 | -9,642 | -2,38493 | 0,008541 | 0,012 | 0,01 | 0,003459 | -0,00146 |
7 | -9,396 | -2,33456 | 0,009783 | 0,014 | 0,012 | 0,004217 | -0,00222 |
… | … | … | … | … | … | … | … |
495 | 12,29 | 2,105361 | 0,98237 | 0,99 | 0,988 | 0,00763 | -0,00563 |
496 | 12,774 | 2,204454 | 0,986254 | 0,992 | 0,99 | 0,005746 | -0,00375 |
497 | 13,832 | 2,421065 | 0,992262 | 0,994 | 0,992 | 0,001738 | 0,000262 |
498 | 13,981 | 2,451571 | 0,992888 | 0,996 | 0,994 | 0,003112 | -0,00111 |
499 | 14,237 | 2,503984 | 0,99386 | 0,998 | 0,996 | 0,00414 | -0,00214 |
500 | 14,732 | 2,605328 | 0,995411 | 1 | 0,998 | 0,004589 | -0,00259 |
Из таблицы 3 следует, что:
,
.
=
Далее = 0,59782. Из таблицы 2 имеем = 0,895.
Так
как =0,59782 < =0,895,
гипотеза нормальности
распределения не отклоняется.
1.3 Получение точечных и интервальных оценок параметров распределения
1.3.1 Сущность задачи точечного и интервального оценивания параметров
Точечная оценка предполагает нахождение единственной числовой величины, которая и принимается за значение параметра. Такую оценку целесообразно определять в тех случаях, когда объем экспериментальных данных достаточно велик. Причем не существует единого понятия о достаточном объеме экспериментальных данных, его значение зависит от вида оцениваемого параметра. При малом объеме экспериментальных данных точечные оценки могут значительно отличаться от истинных значений параметров, что делает их непригодными для использования.
Интервальный метод оценивания параметров распределения случайных величин заключается в определении интервала (а не единичного значения), в котором с заданной степенью достоверности будет заключено значение оцениваемого параметра. Интервальная оценка характеризуется двумя числами – концами интервала, внутри которого предположительно находится истинное значение параметра. Иначе говоря, вместо отдельной точки для оцениваемого параметра можно установить интервал значений, одна из точек которого является своего рода "лучшей" оценкой. Интервальные оценки являются более полными и надежными по сравнению с точечными, они применяются как для больших, так и для малых выборок. Совокупность методов определения промежутка, в котором лежит значение параметра Т, получила название методов интервального оценивания.
Для
нормального распределения
1.3.2 Точечные оценки параметров распределения
Согласно [3] оценка среднего значения выборки из генеральной совокупности производится по формуле (6):
Точечная оценка дисперсии D и стандартного отклонения σ генеральной совокупности осуществляется по формулам (7), (8):
1.3.3 Определение объема выборки для получения оценок с заданной точностью
В производстве при оценке мат.ожидания и дисперсии нерационально работать с выборками большого объема, так как это требует больших финансовых и временных затрат. В соответствии с этим объем выборки для получения интервальных оценок параметров распределения должен быть небольшим и определяться по формуле (9):
, (9)
где - квантиль распределения Стьюдента с ν = n – 1 степенями свободы и уровнем значимости 1 – α/2 (α = 0,01);
εдоп = 0,5 – показывает величину доверительного интервала, отнесенного к стандартному отклонению случайной величины;
n – объем выборки.
Подберем такой объем выборки n, чтобы выполнялось равенство (9). Это возможно при n=30:
Таким
образом объем выборки, достаточный
для получения интервальных оценок с заданной
точностью εдоп = 0,5, равен 30. В Приложении
Б представлена выборка необходимого
объема, полученная с помощью генератора
случайных чисел.
1.3.4 Интервальная оценка математического ожидания
Определим интервальную оценку мат. ожидания заданной выборки из генеральной совокупности согласно методике, описанной в [3]. Для этого заполним таблицу 4.
Таблица 4 – Определение интервальной оценки мат.ожидания выборки
Статистические и исходные данные | Табличные данные и вычисления |
1
Объем выборки:
|
1 Квантиль распределения
Стьюдента уровня
с
степенями свободы:
|
2
Сумма значений наблюдаемых |
2 Квантиль распределения
Стьюдента уровня
с
степенями свободы:
|
3
Сумма квадратов значений |
3 Вычисляем:
|
4
Степени свободы:
|
4 Вычисляем:
|
5
Выбранная доверительная |
5 Вычисляем:
|
6
Вычисляем:
| |
7
Вычисляем:
| |
Результат | |
Двусторонний
симметричный доверительный интервал
для параметра
:
|