Автор работы: Пользователь скрыл имя, 18 Декабря 2009 в 21:54, Не определен
Курсовая работа
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ
Московский Авиационный институт
(Государственный технический университет)
«МАИ»
Кафедра
804
Курсовая работа по курсу
«Теория
вероятностей и математическая статистика»
На тему «Метод
наименьших квадратов»
Выполнила курсовую работу
студентка группы 05-206
Зуева Татьяна Анатольевна
Москва 2005
Оглавление
1.Исходные
данные
Номер | Время X | Величина Y |
1 | -1 | 6,323 |
2 | -0,95 | -22,817 |
3 | -0,9 | -24,908 |
4 | -0,85 | 20,708 |
5 | -0,8 | 9,145 |
6 | -0,75 | -1,283 |
7 | -0,7 | 39,694 |
8 | -0,65 | -16,954 |
9 | -0,6 | 29,198 |
10 | -0,55 | -43,22 |
11 | -0,5 | 11,371 |
12 | -0,45 | -5,745 |
13 | -0,4 | 11,171 |
14 | -0,35 | 1,058 |
15 | -0,3 | -15,19 |
16 | -0,25 | -45,976 |
17 | -0,2 | -0,25 |
18 | -0,15 | -18,76 |
19 | -0,1 | 14,7 |
20 | -0,05 | -17,959 |
21 | 0 | -0,377 |
22 | 0,05 | -12,988 |
23 | 0,1 | 55,728 |
24 | 0,15 | -2,009 |
25 | 0,2 | -4,523 |
26 | 0,25 | -11,937 |
27 | 0,3 | -17,419 |
28 | 0,35 | 1,564 |
29 | 0,4 | 12 |
30 | 0,45 | -25,92 |
31 | 0,5 | 29,946 |
32 | 0,55 | -27,554 |
33 | 0,6 | -6,12 |
34 | 0,65 | -5,25 |
35 | 0,7 | -7,488 |
36 | 0,75 | -29,674 |
37 | 0,8 | -34,196 |
38 | 0,85 | -0,239 |
39 | 0,9 | 4,966 |
40 | 0,95 | -5,11 |
41 | 1 | -7,541 |
Постановка задачи
Числа не соответствуют внутренним числам, так как прибор имеет шумы
yt=axt+b
+εt, t=
где a,b – неизвестные коэффициенты, а εt – независимые в совокупности случайные величины с нормальным законом распределения: εt~N(0,σ2), где σ2 неизвестная дисперсия; 0 – математическое ожидание шума εt. М εt=0, D εt= σ2.
Требуется найти методом наименьших квадратов неизвестные параметры кривой регрессии.
y(x)=ax+b – кривая регрессии – условное матожидание случайной величины Y при аргументе x, М(y/x).
б). Построить график линии регрессии ỹ(x).
Теоретическая часть
1.Выборка.
Математическая статистика – наука о математических методах, позволяющих по статистическим данным, например по реализациям случайной величины (СВ), построить теоретико-вероятностную модель исследуемого явления. Задачи математической статистики являются, в некотором смысле, обратными к задачам теории вероятностей. Центральным понятием математической статистики является выборка.
Определение 1. Однородной выборкой (выборкой) объема n при n 1 называется случайный вектор Zn=col(X1,…,Xn), компоненты которого Xi, i= , называемые элементами выборки, являются независимыми СВ с одной и той же функцией распределения F(x). Будем говорить, что выборка Zn соответствует функции распределения F(x).
Числа, данные, полученные после опыта – апостериорная выборка.
Определение 2. Реализацией выборки называется неслучайный вектор zn=col(x1,…,xn), компонентами которого являются реализации соответствующих элементов выборки Xi, i= .
Из этих определений вытекает, что реализацию выборки zn можно также рассматривать как последовательность x1,…,xn из n реализаций одной и той же СВ X, полученных в серии из n независимых одинаковых опытов, проводимых в одинаковых условиях. Поэтому можно говорить, что выборка Zn порождена наблюдаемой СВ X, имеющей распределение Fx(x)=F(x).
Определение 3. Если компоненты вектора Zn независимы, но их распределения F1(x1),…,Fn(xn) различны, то такую выборку называют неоднородной.
Определение 4. Множество S всех реализаций выборки Zn называется выборочным пространством.
Выборочное пространство может быть всем n-мерным евклидовым пространством Irn или его частью, если СВ X непрерывна, а также может состоять из конечног или счетного числа точек из Irn, если СВ X дискретна.
На практике при исследовании конкретного эксперимента распределения F1(x1),…,Fn(xn) СВ X1,…,Xn редко бывают известны полностью. Часто априори (до опыта) можно лишь утверждать, что распределение FZn(zn)=F1(x1),…Fn(xn) случайного вектора Zn принадлежит некоторому классу (семейству) F.
Определение 5. Пара (S,F) называется статистической моделью описания серии опытов, порождающих выборку Zn.
Определение 6. Если распределение FZn(zn,Ө) из класса F определены с точностью до некоторого векторного параметра Ө Θ IRs, то такая статистическая модель называется параметрической и обозначается (S Ө, FZn(zn, Ө)), Ө Θ IRs.
В некоторых случаях выборочное пространство может не зависеть от неизвестного параметра Ө распределения FZn(zn,Ө).
В зависимости от вида статистической модели в математической статистике формулируются соответствующие задачи по обработке информации, содержащейся в выборке.
Определение
7. СВ Z=φ(Zn), где φ(Zn) – произвольная
функция, определенная на выборочном пространстве
S и не зависящая от распределения FZn(zn,Ө),
называется статистикой.
2. Точечные оценки.
Определение 2.1. Параметром распределения Ө Θ IR1 СВ X называется любая числовая характеристика этой СВ ( математическое ожидание, дисперсия и т.п.) или любая константа, явно входящая в выражение для функции распределения.
В общем случае будем предполагать, что параметр распределения Ө может быть векторным, т.е. Ө Θ IRs.
В случае параметрической статистической модели (S Ө, FZn(zn,Ө)) таким параметром распределения может служить неизвестный вектор Ө Θ IRs, характеризующий распределение FZn(zn,Ө).
Пусть имеется выборка Zn=col(X1,…Xn) с реализацией zn=(x1,…xn).
Определение 2.2. Точечной (выборочной) оценкой неизвестного параметра распределения Ө Θ IRs называется произвольная статистика (Zn), построенная по выборке Zn и принимающая значения в множестве Θ.
Замечание 2.1. Реализацию (zn) оценки (Zn), принимают, как правило, за приближенное значение неизвестного параметра Ө.
Ясно, что существует много разных способов построения точечной оценки которые учитывают тип статистической модели. Для параметрической и не параметрической моделей эти способы могут быть различны. Рассмотрим некоторые свойства, которые характеризуют качество введенной оценки.
Определение 2.3. Оценка (Zn) параметра Ө называется несмещенной, если ее МО равно Ө , т.е. M[ (Zn)]= Ө для любого Ө Θ.
Определение 2.4. Оценка (Zn) параметра Ө называется состоятельной, если она сходится по вероятности к Ө, т.е. (Zn) Ө при n → ∞ для любого Ө Θ.
Определение 2.5. Оценка (Zn) параметра Ө называется сильно состоятельной, если она сходится почти наверное к Ө, т.е. (Zn) Ө при n → ∞ для любого Ө Θ.
Определение 2.6. Несмещенная оценка *(Zn) скалярного параметра Ө называется эффективной, если D[ *(Zn)]≤ D[ (Zn)] для всех несмещенных оценок (Zn) параметра Ө, т.е. ее дисперсия минимальна по сравнению с дисперсиями других несмещенных оценок при одном и том же объеме n выборки Zn.
Вообще говоря, дисперсии несмещенных оценок могут зависеть о параметра Ө. В этом случае под эффективной оценкой понимается такая, для которой вышеприведенное неравенство является строгим хотя бы для одного значения параметра Ө.
3.Интервальные оценки.
Пусть
имеется параметрическая
Определение 3.1. Интервал [θ1(Zn),θ2(Zn)] со случайными концами, «накрывающий» с вероятностью 1-α, 0<α<1, неизвестный параметр θ, т.е.
P{ θ1(Zn)≤ θ ≤ θ2(Zn)}= 1-α,
называется доверительным интервалом (или интервальной оценкой) уровня надежности 1-α параметра θ.
Аналогично определяется доверительный интервал для произвольной функции от параметра θ.
Определение
3.2. Число δ=1-α называется доверительной
вероятностью или уровнем
доверия (надежности).
Определение 3.3. Доверительный интервал [θ1(Zn),θ2(Zn)] называется центральным, если выполняются следующие условия:
P{ θ≥ θ2(Zn)}=
Часто вместо двусторонних доверительных интервалов рассматривают односторонние доверительные интервалы, полагая θ1(Zn)= -∞ или θ2(Zn)= +∞.
Определение 3.4. Интервал, границы которого удовлетворяют условию:
P{ θ≥ θ2(Zn)}= α (или P{ θ1(Zn) ≥ θ}= α.),
называется
соответственно правосторонним (или
левосторонним) доверительным интервалом.
4.Проверка статистических гипотез.
Определение 4.1. Статистической гипотезой H или просто гипотезой называется любое предположение относительно параметров ли законов распределения СВ X, проверяемое по выборке Zn.