Автор работы: Пользователь скрыл имя, 04 Марта 2015 в 11:36, контрольная работа
Задание 1. Описательная статистика
Для заданной выборки определить описательные характеристики двумя способами: первый – используя соответствующие функции, второй – используя режим «Описательная статистика» пакета «Анализ данных», сравнить полученные результаты, сделать выводы об исходной выборке по полученным данным.
Приведем исходные данные для задачи
Таблица 7
Ранжированный исходный ряд
108,8 |
108,8 |
109,0 |
110,9 |
111,7 |
111,9 |
113,3 |
Построим интервальный вариационный ряд.
Число интервалов:
k = 1+3,22*log(n) = 1+3,22*log(7) = 3,704 = 4
Ширина интервала ∆ = (xmax-xmin)/4 = (113,3-108,8) = 1,125
Таблица 8
Интервальный вариационный ряд
Группы |
Частота, fi |
Накопленная частота, S |
108,8 - 109,93 |
3 |
3 |
109,93 - 111,06 |
1 |
4 |
111,06 - 112,19 |
2 |
6 |
112,19 - 113,32 |
1 |
7 |
Итого |
7 |
|
Построим гистограмму и кумуляту используя вставку диаграммы Excel.
Рис. 2 Гистограмма и кумулята для интервального вариационного ряда (режим вставки в Excel)
Построим гистограмму и кумуляту используя режим «Гистограмма» пакета «Анализ данных».
Таблица 9
Расчетные данные
Карман |
Частота |
Интегральный % |
109,93 |
3 |
42,86% |
111,06 |
1 |
57,14% |
112,19 |
2 |
85,71% |
113,32 |
1 |
100,00% |
Здесь «карман» - правая граница интервала.
Рис. 3 Гистограмма и кумулята для интервального вариационного ряда (режим «Гистограмма» пакета «Анализ данных»)
По данным таблицы 10 определить степень взаимосвязи между двумя случайными величинами X и Y. В качестве меры такой связи использовать коэффициент линейной корреляции (Пирсона), предполагающий нормальный закон распределения наблюдений (выполняется с помощью функции Microsoft Excel – КОРРЕЛ)
Таблица 10
Исходные данные
№ п/ п |
Страна |
X=х(9) |
Y=х(12) |
1 |
Австралия |
2,3 |
1,38 |
2 |
Австрия |
94 |
0,2 |
3 |
Аргентина |
12 |
1,3 |
4 |
Бангладеш |
800 |
2,4 |
5 |
Беларусь |
50 |
0,32 |
6 |
Бельгия |
329 |
0,2 |
7 |
Бразилия |
18 |
1,28 |
8 |
Буркина-Фасо |
36 |
2,81 |
9 |
Великобритания |
237 |
0,2 |
10 |
Вьетнам |
218 |
1,78 |
11 |
Гаити |
231 |
1,63 |
12 |
Германия |
227 |
0,36 |
13 |
Гондурас |
46 |
2,73 |
14 |
Гонконг |
5494 |
-0,09 |
15 |
Египет |
57 |
1,95 |
16 |
Замбия |
11 |
2,8 |
17 |
Индия |
283 |
1,9 |
18 |
Ирландия |
51 |
0,3 |
19 |
Испания |
77 |
0,25 |
20 |
Италия |
188 |
0,21 |
21 |
Канада |
2,8 |
0,7 |
22 |
Китай |
124 |
1,1 |
23 |
Колумбия |
31 |
2 |
24 |
Коста-Рика |
64 |
2,3 |
25 |
Куба |
99 |
0,95 |
26 |
Малайзия |
58 |
2,3 |
27 |
Марокко |
63 |
2,12 |
28 |
Мексика |
46 |
1,9 |
29 |
Нидерланды |
366 |
0,58 |
30 |
Новая Зеландия |
13 |
0,57 |
31 |
Норвегия |
11 |
0,4 |
32 |
ОАЭ |
32 |
4,8 |
33 |
Польша |
123 |
0,3 |
34 |
Португалия |
108 |
0,36 |
35 |
Россия |
8,8 |
0,2 |
36 |
Саудовская Аравия |
7,7 |
3,2 |
37 |
Северная Корея |
189 |
1,83 |
38 |
Сингапур |
4456 |
1,2 |
39 |
США |
26 |
0,99 |
40 |
Таиланд |
115 |
1,4 |
41 |
Турция |
79 |
2,02 |
42 |
Украина |
87 |
0,05 |
43 |
Филиппины |
221 |
1,92 |
44 |
Финляндия |
39 |
0,3 |
Для предварительной проверки наличия связи между Y и X построим корреляционное поле.
Рис. 4 Корреляционное поле
Из рис. 4 можно сделать предварительный вывод, что корреляция между рассматриваемыми величинами отсутствует.
Функция «Коррел» возвращает коэффициент корреляции между диапазонами ячеек "массив1" и "массив2". Коэффициент корреляции используется для определения взаимосвязи между двумя свойствами.
Уравнение для коэффициента корреляции имеет следующий вид:
и равен коэффициенту линейной корреляции Пирсона.
Применение данной функции в Excel дает:
коррел = |
-0,17198687 |
Очевидно что связь между X и Y практически отсутствует и является обратной.
По данным таблицы 11 определить степень взаимосвязи между случайными величинами X1, Х2, Х3, Х4, Х5 и Y, отобразить меры связи в корреляционной матрице; прокомментировать результаты (выполняется с применением режима «Корреляция» пакета «Анализ данных» Microsoft Excel).
Таблица 11
Исходные данные
№п/ п |
Страна |
Y, х(12) |
X1, х(1) |
X2, х(2) |
X3, х(3) |
X4, х(8) |
X5, х(11) |
1 |
Австралия |
1,38 |
17 800 |
15 |
8 |
16 848 |
100 |
2 |
Австрия |
0,2 |
8 000 |
12 |
11 |
18 396 |
99 |
3 |
Аргентина |
1,3 |
33 900 |
20 |
9 |
3 408 |
95 |
4 |
Бангладеш |
2,4 |
125 000 |
35 |
11 |
202 |
35 |
5 |
Беларусь |
0,32 |
10 300 |
13 |
11 |
6 500 |
99 |
6 |
Бельгия |
0,2 |
10 100 |
12 |
11 |
17 912 |
99 |
7 |
Бразилия |
1,28 |
156 600 |
21 |
9 |
2 354 |
81 |
8 |
Буркина-Фасо |
2,81 |
10 000 |
47 |
18 |
357 |
18 |
9 |
Великобритания |
0,2 |
58 400 |
13 |
11 |
15 974 |
99 |
10 |
Вьетнам |
1,78 |
73 100 |
27 |
8 |
230 |
88 |
11 |
Гаити |
1,63 |
6 500 |
40 |
19 |
383 |
53 |
12 |
Германия |
0,36 |
81 200 |
11 |
11 |
17 539 |
99 |
13 |
Гондурас |
2,73 |
5 600 |
35 |
6 |
1 030 |
73 |
14 |
Гонконг |
-0,09 |
5 800 |
13 |
6 |
14 641 |
77 |
15 |
Египет |
1,95 |
60 000 |
29 |
9 |
748 |
48 |
16 |
Замбия |
2,8 |
9 100 |
46 |
18 |
573 |
73 |
17 |
Индия |
1,9 |
911 600 |
29 |
10 |
275 |
52 |
18 |
Ирландия |
0,3 |
3 600 |
14 |
9 |
12 170 |
98 |
19 |
Испания |
0,25 |
39 200 |
11 |
9 |
13 047 |
95 |
20 |
Италия |
0,21 |
58 100 |
11 |
10 |
17 500 |
97 |
21 |
Канада |
0,7 |
29100 |
14 |
8 |
19904 |
97 |
22 |
Китай |
1,1 |
1205200 |
21 |
7 |
7 |
78 |
23 |
Колумбия |
2 |
35600 |
24 |
6 |
1538 |
87 |
24 |
Коста-Рика |
2,3 |
3300 |
26 |
4 |
2031 |
93 |
25 |
Куба |
0,95 |
11100 |
17 |
7 |
1382 |
94 |
26 |
Малайзия |
2,3 |
19500 |
29 |
5 |
2995 |
78 |
27 |
Марокко |
2,12 |
28600 |
29 |
6 |
1062 |
50 |
28 |
Мексика |
1,9 |
91800 |
28 |
5 |
3604 |
87 |
29 |
Нидерланды |
0,58 |
15400 |
13 |
9 |
17245 |
99 |
30 |
Новая Зеландия |
0,57 |
3524 |
16 |
8 |
14381 |
99 |
31 |
Норвегия |
0,4 |
4300 |
13 |
10 |
17755 |
99 |
32 |
ОАЭ |
4,8 |
2800 |
28 |
3 |
14193 |
68 |
33 |
Польша |
0,3 |
38600 |
14 |
10 |
4429 |
99 |
34 |
Португалия |
0,36 |
10500 |
12 |
10 |
9000 |
85 |
35 |
Россия |
0,2 |
149200 |
13 |
11 |
6680 |
99 |
36 |
Саудовская Аравия |
3,2 |
18000 |
38 |
6 |
6651 |
62 |
37 |
Северная Корея |
1,83 |
23100 |
24 |
6 |
1000 |
99 |
38 |
Сингапур |
1,2 |
2900 |
16 |
6 |
14990 |
88 |
39 |
США |
0,99 |
260800 |
15 |
9 |
23474 |
97 |
40 |
Таиланд |
1,4 |
59400 |
19 |
6 |
1800 |
93 |
41 |
Турция |
2,02 |
62200 |
26 |
6 |
3721 |
81 |
42 |
Украина |
0,05 |
51800 |
12 |
13 |
2340 |
97 |
43 |
Филиппины |
1,92 |
69800 |
27 |
7 |
867 |
90 |
44 |
Финляндия |
0,3 |
5100 |
13 |
10 |
15877 |
100 |
Определим степень взаимосвязи между случайными величинами X1, Х2, Х3, Х4, Х5 и Y, отобразим меры связи в корреляционной матрице, полученной с применением режима «Корреляция» пакета «Анализ данных» Microsoft Excel).
Рис. 5 Диалоговое окно режима «Корреляция» пакета «Анализ данных»
В результате получим следующую таблицу:
Таблица 12
Расчет степень взаимосвязи между случайными величинами X1, Х2, Х3, Х4, Х5 и Y
Y, х(12) |
X1, х(1) |
X2, х(2) |
X3, х(3) |
X4, х(8) |
X5, х(11) | |
Y, х(12) |
1 |
|||||
X1, х(1) |
0,012267 |
1 |
||||
X2, х(2) |
0,834368 |
0,047963 |
1 |
|||
X3, х(3) |
-0,22646 |
-0,03637 |
0,193453 |
1 |
||
X4, х(8) |
-0,49068 |
-0,21751 |
-0,664 |
-0,0299 |
1 |
|
X5, х(11) |
-0,62933 |
-0,17894 |
-0,79862 |
-0,24411 |
0,516363 |
1 |
Из таблицы 12 видно, что между:
Y и X1 – связь очень слабая и прямая
Y и X2 – связь сильная и прямая
Y и X3 – связь слабая и обратная
Y и X4 – связь средняя и обратная
Y и X5 – связь достаточно сильная и обратная
Можно также отметить наличие сильной и обратной связи между X5 и X2.
По данным таблицы 11 построить линейное уравнение регрессии, устанавливающее зависимость между случайной величиной Y (зависимым результативным признаком) и значениями переменных величин Х1, Х2, Х3, Х4, Х5; провести оценку параметров модели; определить границы доверительных интервалов; проверить адекватность принятой математической модели экспериментальным данным (выполняется с применением режимов «Корреляция» и «Регрессия» пакета «Анализ данных» Microsoft Excel).
Воспользуемся режимом «Регрессия» пакета «Анализ данных» Microsoft Excel
Рис. 5 Диалоговое окно режима «Регрессия» пакета «Анализ данных»
В результате получим следующую таблицу 13:
Таблица 13
Расчетные данные
ВЫВОД ИТОГОВ |
||||||||
Регрессионная статистика |
||||||||
Множественный R |
0,933791 |
|||||||
R-квадрат |
0,871965 |
|||||||
Нормированный R-квадрат |
0,855119 |
|||||||
Стандартная ошибка |
0,403541 |
|||||||
Наблюдения |
44 |
|||||||
Дисперсионный анализ |
||||||||
df |
SS |
MS |
F |
Значимость F |
||||
Регрессия |
5 |
42,1433794 |
8,428676 |
51,7588739 |
6,17549E-16 |
|||
Остаток |
38 |
6,188111514 |
0,162845 |
|||||
Итого |
43 |
48,33149091 |
||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |
Y-пересечение |
-0,1114 |
0,740629317 |
-0,15041 |
0,88123658 |
-1,610723854 |
1,387927 |
-1,61072 |
1,387927 |
X1, х(1) |
-6,2E-08 |
2,95806E-07 |
-0,2105 |
0,83440412 |
-6,61094E-07 |
5,37E-07 |
-6,6E-07 |
5,37E-07 |
X2, х(2) |
0,111473 |
0,012335781 |
9,036533 |
5,2744E-11 |
0,086500208 |
0,136445 |
0,0865 |
0,136445 |
X3, х(3) |
-0,13111 |
0,018768192 |
-6,98556 |
2,5724E-08 |
-0,16910056 |
-0,09311 |
-0,1691 |
-0,09311 |
X4, х(8) |
2,62E-05 |
1,15954E-05 |
2,263369 |
0,02940773 |
2,77101E-06 |
4,97E-05 |
2,77E-06 |
4,97E-05 |
X5, х(11) |
-1,8E-05 |
0,005417967 |
-0,00329 |
0,99739119 |
-0,010985932 |
0,01095 |
-0,01099 |
0,01095 |