Автор работы: Пользователь скрыл имя, 02 Июня 2016 в 12:54, задача
1  
Шести томное собрание сочинений Н.В.Гоголя поместили на полку в случайном порядке . какова вероятность того, что тома стоят в порядке возрастания номеров?
Теория вероятности
| 1   | 14:36:43 | 
21 Вероятность поражения земляники вирусным заболеванием равна 0,2. Составить закон распределения числа кустов земляники, зараженных вирусом, из четырех посаженных кустов. Найти математическое ожидание и дисперсию этой случайной величины.
Ответ:
| X | 0 | 1 | 2 | 3 | 4 | 
| P | 0,4096 | 0,4096 | 0,1536 | 0,0256 | 0,0016 | 
;
.
2 Математическая статистика
Корреляционная таблица:
| Y / X | 4 | 9 | 14 | 19 | 24 | 29 | 
| 10 | 2 | 3 | 0 | 0 | 0 | 0 | 
| 20 | 0 | 7 | 3 | 0 | 0 | 0 | 
| 30 | 0 | 0 | 2 | 50 | 2 | 0 | 
| 40 | 0 | 0 | 1 | 10 | 6 | 0 | 
| 50 | 0 | 0 | 0 | 4 | 7 | 3 | 
 
Уравнение 
линейной регрессии с y на x имеет вид: 
 
Уравнение линейной 
регрессии с x на y имеет вид: 
 
Найдем необходимые 
числовые характеристики. 
Выборочные средние: 
 
= (4*2 + 9(3 + 7) + 14(3 + 2 + 1) 
+ 19(50 + 10 + 4) + 24(2 + 6 + 7) + 29*3)/100 = 18.45 
 
= (10(2 + 3) + 20(7 + 3) + 30(2 + 
50 + 2) + 40(1 + 10 + 6) + 50(4 + 7 + 3))/100 = 32.5 
Дисперсии: 
σ2x = (42*2 + 92(3 + 7) + 142(3 + 2 + 1) + 192(50 + 10 + 4) + 242(2 + 6 + 7) + 292*3)/100 - 18.452 = 22.45 
σ2y = (102(2 + 3) + 202(7 + 3) + 302(2 + 50 + 2) + 402(1 + 10 + 6) + 502(4 + 7 + 3))/100 
- 32.52= 96.75 
Откуда получаем среднеквадратические 
отклонения: 
σx = 4.74 и σy = 9.84 
и ковариация: 
Cov(x,y) = (4•10•2 + 9•10•3 
+ 9•20•7 + 14•20•3 + 14•30•2 + 19•30•50 + 24•30•2 
+ 14•40•1 + 19•40•10 + 24•40•6 + 19•50•4 + 24•50•7 
+ 29•50•3)/100 - 18.45 • 32.5 = 37.38 
Определим коэффициент 
корреляции: 
 
 
Запишем уравнения 
линий регрессии y(x): 
 
и вычисляя, получаем: 
yx = 1.66 x + 1.79 
Запишем уравнения 
линий регрессии x(y): 
 
и вычисляя, получаем: 
xy = 0.39 y + 5.9 
Если построить точки, 
определяемые таблицей и линии регрессии, 
увидим, что обе линии проходят через точку 
с координатами (18.45; 32.5) и точки расположены 
близко к линиям регрессии. 
Значимость 
коэффициента корреляции. 
 
По таблице Стьюдента 
с уровнем значимости α=0.05 и степенями 
свободы k=100-m-1 = 98 находим tкрит: 
tкрит (n-m-1;α/2) = (98;0.025) 
= 1.984 
где m = 1 - количество 
объясняющих переменных. 
Если tнабл > tкритич, то полученное 
значение коэффициента корреляции признается 
значимым (нулевая гипотеза, утверждающая 
равенство нулю коэффициента корреляции, 
отвергается). 
Поскольку tнабл > tкрит, то отклоняем 
гипотезу о равенстве 0 коэффициента корреляции. 
Другими словами, коэффициент корреляции 
статистически - значим. 
2) F-статистика. Критерий 
Фишера. 
Оценка статистической 
значимости парной линейной регрессии 
производится по следующему алгоритму: 
1. Выдвигается нулевая 
гипотеза о том, что уравнение в целом 
статистически незначимо: H0: R2=0 на уровне 
значимости α. 
2. Далее определяют 
фактическое значение F-критерия: 
 
 
где m=1 для парной регрессии. 
3. Табличное значение 
определяется по таблицам распределения 
Фишера для заданного уровня значимости, 
принимая во внимание, что число степеней 
свободы для общей суммы квадратов (большей 
дисперсии) равно 1 и число степеней свободы 
остаточной суммы квадратов (меньшей дисперсии) 
при линейной регрессии равно n-2. 
Fтабл - это максимально 
возможное значение критерия под влиянием 
случайных факторов при данных степенях 
свободы и уровне значимости α. Уровень 
значимости α - вероятность отвергнуть 
правильную гипотезу при условии, что 
она верна. Обычно α принимается равной 
0,05 или 0,01. 
4. Если фактическое 
значение F-критерия меньше табличного, 
то говорят, что нет основания отклонять 
нулевую гипотезу. 
В противном случае, 
нулевая гипотеза отклоняется и с вероятностью 
(1-α) принимается альтернативная гипотеза 
о статистической значимости уравнения 
в целом. 
Табличное значение 
критерия со степенями свободы k1=1 и k2=98, Fтабл = 3.92 
Отметим значения на 
числовой оси.
| Принятие H0 | Отклонение H0, принятие H1 | 
| 95% | 5% | 
| 3.92 | 176.54 | 
 
Поскольку 
фактическое значение F > Fтабл, то коэффициент 
детерминации статистически значим (найденная 
оценка уравнения регрессии статистически 
надежна).
Поле корреляции (пример построения 
в Excel) 
Y = 1.6647x + 1.786 и X = 0.3862y 
+ 5.899