Метод наименьших квадратов

Автор работы: Пользователь скрыл имя, 18 Декабря 2009 в 21:54, Не определен

Описание работы

Курсовая работа

Файлы: 1 файл

Курсач ТВиМС.doc

— 685.00 Кб (Скачать файл)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

Московский  Авиационный институт

(Государственный  технический университет)

«МАИ»

Кафедра 804 
 

Курсовая  работа по курсу 

«Теория вероятностей и математическая статистика»  
 

На тему «Метод наименьших квадратов» 
 
 
 
 

Выполнила курсовую работу

студентка     группы    05-206

Зуева Татьяна Анатольевна

                                                                                   Дата сдачи КР                  

                                                                                  Проверил курсовую работу

                                                                                 Шин     Галина    Захаровна 

Москва 2005

Оглавление

  1. Исходные данные………………………………………………….3
  2. Постановка задачи…………………………………………………4
  3. Теоретическая часть……………………………………………….5
  4. Расчетная часть……………………………………………………10
  5. График …………………………………………………………….16
  6. Приложение………………………………………………………..17
  7. Список литературы………………………………………………  18
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

1.Исходные данные 
 

Номер Время X Величина Y
1 -1 6,323
2 -0,95 -22,817
3 -0,9 -24,908
4 -0,85 20,708
5 -0,8 9,145
6 -0,75 -1,283
7 -0,7 39,694
8 -0,65 -16,954
9 -0,6 29,198
10 -0,55 -43,22
11 -0,5 11,371
12 -0,45 -5,745
13 -0,4 11,171
14 -0,35 1,058
15 -0,3 -15,19
16 -0,25 -45,976
17 -0,2 -0,25
18 -0,15 -18,76
19 -0,1 14,7
20 -0,05 -17,959
21 0 -0,377
22 0,05 -12,988
23 0,1 55,728
24 0,15 -2,009
25 0,2 -4,523
26 0,25 -11,937
27 0,3 -17,419
28 0,35 1,564
29 0,4 12
30 0,45 -25,92
31 0,5 29,946
32 0,55 -27,554
33 0,6 -6,12
34 0,65 -5,25
35 0,7 -7,488
36 0,75 -29,674
37 0,8 -34,196
38 0,85 -0,239
39 0,9 4,966
40 0,95 -5,11
41 1 -7,541
 
 
 

    Постановка  задачи

  1. а).Задано множество пар значений {(xt,yt)}, t= (n=41), представляющих собой результаты измерений функции. Дан прибор, который генерирует функцию y(x)=ax+b. На вход поступает сигнал x1,x2,..,xn; на выходе: y1,y2,…,yn.

      Числа не соответствуют внутренним числам, так как прибор имеет шумы

    yt=axt+b +εt, t=

    ,

    где a,b – неизвестные коэффициенты, а εt – независимые в       совокупности случайные величины с нормальным законом распределения:  εt~N(0,σ2), где σ2 неизвестная дисперсия; 0 – математическое ожидание шума εt. М εt=0, D εt= σ2.

      Требуется найти методом наименьших квадратов  неизвестные параметры кривой регрессии.

      y(x)=ax+b – кривая регрессии – условное матожидание случайной величины Y при аргументе x, М(y/x).

   б). Построить график линии регрессии  ỹ(x).

  1. Найти точечную оценку для неизвестного параметра неизвестной дисперсии σ2 , которая входит в нормальный закон распределения.
  2. Построить интервальные оценки для неизвестных коэффициентов a,b и дисперсии σ2 на уровне доверия j1=0,9; j2=0,95.
  3. С помощью критерия Снедекера-Фишера проверить гипотезу Ho: a=0 и гипотезу Ho: b=0 на уровне доверия j1=0,9 и j2=0,95.
 
 
 
 
 
 
 

Теоретическая часть

1.Выборка.

     Математическая  статистика – наука о математических методах, позволяющих по статистическим данным, например по реализациям случайной величины (СВ), построить теоретико-вероятностную модель исследуемого явления. Задачи математической статистики являются, в некотором смысле, обратными к задачам теории вероятностей. Центральным понятием математической статистики является выборка.

     Определение 1. Однородной выборкой (выборкой) объема n при n 1 называется случайный вектор Zn=col(X1,…,Xn), компоненты которого Xi, i= , называемые элементами выборки, являются независимыми СВ с одной и той же функцией распределения F(x). Будем говорить, что выборка Zn соответствует функции распределения F(x).

     Числа, данные, полученные после опыта –  апостериорная выборка.

     Определение 2. Реализацией выборки называется неслучайный вектор zn=col(x1,…,xn), компонентами которого являются реализации соответствующих элементов выборки Xi, i= .

     Из  этих определений вытекает, что реализацию выборки zn можно также рассматривать как последовательность x1,…,xn из n реализаций одной и той же СВ X, полученных в серии из n независимых одинаковых опытов, проводимых в одинаковых условиях. Поэтому можно говорить, что выборка Zn порождена наблюдаемой СВ X, имеющей распределение Fx(x)=F(x).

     Определение 3. Если компоненты вектора Zn независимы, но их распределения F1(x1),…,Fn(xn) различны, то такую выборку называют неоднородной.

     Определение 4. Множество S всех реализаций выборки Zn называется выборочным пространством.

     Выборочное  пространство может быть всем n-мерным евклидовым пространством Irn или его частью, если СВ X непрерывна, а также может состоять из конечног или счетного числа точек из Irn, если СВ X дискретна.

     На  практике при исследовании конкретного  эксперимента распределения F1(x1),…,Fn(xn) СВ X1,…,Xn редко бывают известны полностью. Часто априори (до опыта) можно лишь утверждать, что распределение FZn(zn)=F1(x1),…Fn(xn) случайного вектора Zn принадлежит некоторому классу (семейству) F.

     Определение 5. Пара (S,F) называется статистической моделью описания серии опытов, порождающих выборку Zn.

     Определение 6. Если распределение FZn(zn,Ө) из класса F определены с точностью до некоторого векторного параметра Ө Θ IRs, то такая статистическая модель называется  параметрической и обозначается  (S Ө, FZn(zn, Ө)), Ө Θ IRs.

      В некоторых случаях выборочное пространство может не зависеть от неизвестного параметра Ө распределения FZn(zn,Ө).

      В зависимости от вида статистической модели в математической статистике формулируются соответствующие задачи по обработке информации, содержащейся в выборке.

      Определение 7. СВ Z=φ(Zn), где φ(Zn) – произвольная функция, определенная на выборочном пространстве S и не зависящая от распределения FZn(zn,Ө), называется статистикой. 
 
 
 
 

2. Точечные оценки.

     Определение 2.1. Параметром распределения Ө Θ IR1 СВ X называется любая числовая характеристика этой СВ ( математическое ожидание, дисперсия и т.п.) или любая константа, явно входящая в выражение для функции распределения.

      В общем случае будем предполагать, что параметр распределения Ө может быть векторным, т.е. Ө Θ IRs.

      В случае параметрической статистической модели (S Ө, FZn(zn)) таким параметром распределения может служить неизвестный вектор Ө Θ IRs, характеризующий распределение FZn(zn).

Пусть имеется выборка Zn=col(X1,…Xn) с реализацией zn=(x1,…xn).

      Определение 2.2. Точечной (выборочной) оценкой неизвестного параметра распределения Ө Θ IRs называется произвольная статистика (Zn), построенная по выборке Zn и принимающая значения в множестве Θ.

      Замечание 2.1. Реализацию (zn) оценки (Zn), принимают, как правило, за приближенное значение неизвестного параметра Ө.

      Ясно, что существует много разных способов построения точечной оценки которые учитывают тип статистической модели. Для параметрической и не параметрической моделей эти способы могут быть различны. Рассмотрим некоторые свойства, которые характеризуют качество введенной оценки.

      Определение 2.3. Оценка (Zn) параметра Ө называется несмещенной, если ее МО равно Ө , т.е. M[ (Zn)]= Ө для любого Ө Θ.

      Определение 2.4. Оценка (Zn) параметра Ө называется состоятельной, если она сходится по вероятности к Ө, т.е. (Zn) Ө при n → ∞ для любого Ө Θ.

      Определение 2.5. Оценка (Zn) параметра Ө называется сильно состоятельной, если она сходится почти наверное к Ө, т.е. (Zn) Ө при n → ∞ для любого Ө Θ.

      Определение 2.6. Несмещенная оценка *(Zn) скалярного параметра Ө называется эффективной, если D[ *(Zn)]≤ D[ (Zn)] для всех несмещенных оценок (Zn) параметра Ө, т.е. ее дисперсия минимальна по сравнению с дисперсиями других несмещенных оценок при одном и том же объеме n выборки Zn.

      Вообще  говоря, дисперсии несмещенных оценок могут зависеть о параметра Ө. В этом случае под эффективной оценкой понимается такая, для которой вышеприведенное неравенство является строгим хотя бы для одного значения параметра Ө.

3.Интервальные  оценки.

      Пусть имеется параметрическая статистическая модель (SӨ,FZn(zn)), Ө Θ IR1, и по выборке Zn=col(X1,…Xn), соответствующей распределению F(x,Ө), наблюдаемой СВ X, требуется оценить неизвестный параметр Ө. Вместо точечных оценок, рассмотренных ранее, рассмотрим другой тип оценок неизвестного параметра Ө Θ IR1.

      Определение 3.1. Интервал [θ1(Zn),θ2(Zn)] со случайными концами, «накрывающий» с вероятностью 1-α, 0<α<1, неизвестный параметр θ, т.е.

P{ θ1(Zn)≤ θ ≤ θ2(Zn)}= 1-α,

называется  доверительным интервалом (или интервальной оценкой) уровня надежности 1-α параметра θ.

      Аналогично  определяется доверительный интервал для произвольной функции от параметра  θ.

      Определение 3.2. Число δ=1-α называется доверительной вероятностью или уровнем доверия (надежности). 
 
 

     Определение 3.3. Доверительный интервал [θ1(Zn),θ2(Zn)] называется центральным, если выполняются следующие условия:

P{ θ≥ θ2(Zn)}=

, P{ θ1(Zn) ≥ θ}=
.

      Часто вместо двусторонних доверительных интервалов  рассматривают односторонние доверительные интервалы, полагая θ1(Zn)= -∞ или θ2(Zn)= +∞.

      Определение 3.4. Интервал, границы которого удовлетворяют условию:

P{ θ≥ θ2(Zn)}= α  (или P{ θ1(Zn) ≥ θ}= α.),

называется соответственно правосторонним (или левосторонним) доверительным интервалом. 

4.Проверка  статистических гипотез.

Определение 4.1. Статистической гипотезой H или просто гипотезой называется любое предположение относительно параметров ли законов распределения СВ X, проверяемое по выборке Zn.

Информация о работе Метод наименьших квадратов