Контрольная работа по "Статистике"

Автор работы: Пользователь скрыл имя, 04 Марта 2015 в 11:36, контрольная работа

Описание работы

Задание 1. Описательная статистика
Для заданной выборки определить описательные характеристики двумя способами: первый – используя соответствующие функции, второй – используя режим «Описательная статистика» пакета «Анализ данных», сравнить полученные результаты, сделать выводы об исходной выборке по полученным данным.
Приведем исходные данные для задачи

Файлы: 1 файл

6027_стат.docx

— 193.89 Кб (Скачать файл)

 

Таблица 7

Ранжированный исходный ряд

108,8

108,8

109,0

110,9

111,7

111,9

113,3


 

Построим интервальный вариационный ряд.

Число интервалов:

k = 1+3,22*log(n) = 1+3,22*log(7) = 3,704 = 4

Ширина интервала ∆ = (xmax-xmin)/4 = (113,3-108,8) = 1,125

Таблица 8

Интервальный вариационный ряд

Группы

Частота, fi

Накопленная частота, S

108,8 - 109,93

3

3

109,93 - 111,06

1

4

111,06 - 112,19

2

6

112,19 - 113,32

1

7

Итого

7

 

 

 

Построим гистограмму и кумуляту используя вставку диаграммы Excel.

Рис. 2 Гистограмма и кумулята для интервального вариационного ряда (режим вставки в Excel)

Построим гистограмму и кумуляту используя режим «Гистограмма» пакета «Анализ данных».

Таблица 9

Расчетные данные

Карман

Частота

Интегральный %

109,93

3

42,86%

111,06

1

57,14%

112,19

2

85,71%

113,32

1

100,00%


 

Здесь «карман» - правая граница интервала.

Рис. 3 Гистограмма и кумулята для интервального вариационного ряда (режим «Гистограмма» пакета «Анализ данных»)

 

Задание 3. Корреляционный анализ

По данным таблицы 10 определить степень взаимосвязи между двумя случайными величинами X и Y. В качестве меры такой связи использовать коэффициент линейной корреляции (Пирсона), предполагающий нормальный закон распределения наблюдений (выполняется с помощью функции Microsoft Excel – КОРРЕЛ)

Таблица 10

Исходные данные

№ п/ п

Страна

X=х(9)

Y=х(12)

1

Австралия

2,3

1,38

2

Австрия

94

0,2

3

Аргентина

12

1,3

4

Бангладеш

800

2,4

5

Беларусь

50

0,32

6

Бельгия

329

0,2

7

Бразилия

18

1,28

8

Буркина-Фасо

36

2,81

9

Великобритания

237

0,2

10

Вьетнам

218

1,78

11

Гаити

231

1,63

12

Германия

227

0,36

13

Гондурас

46

2,73

14

Гонконг

5494

-0,09

15

Египет

57

1,95

16

Замбия

11

2,8

17

Индия

283

1,9

18

Ирландия

51

0,3

19

Испания

77

0,25

20

Италия

188

0,21

21

Канада

2,8

0,7

22

Китай

124

1,1

23

Колумбия

31

2

24

Коста-Рика

64

2,3

25

Куба

99

0,95

26

Малайзия

58

2,3

27

Марокко

63

2,12

28

Мексика

46

1,9

29

Нидерланды

366

0,58

30

Новая Зеландия

13

0,57

31

Норвегия

11

0,4

32

ОАЭ

32

4,8

33

Польша

123

0,3

34

Португалия

108

0,36

35

Россия

8,8

0,2

36

Саудовская Аравия

7,7

3,2

37

Северная Корея

189

1,83

38

Сингапур

4456

1,2

39

США

26

0,99

40

Таиланд

115

1,4

41

Турция

79

2,02

42

Украина

87

0,05

43

Филиппины

221

1,92

44

Финляндия

39

0,3


 

Для предварительной проверки наличия связи между Y и X построим корреляционное поле.

Рис. 4 Корреляционное поле

Из рис. 4 можно сделать предварительный вывод, что корреляция между рассматриваемыми величинами отсутствует.

Функция «Коррел» возвращает коэффициент корреляции между диапазонами ячеек "массив1" и "массив2". Коэффициент корреляции используется для определения взаимосвязи между двумя свойствами.

Уравнение для коэффициента корреляции имеет следующий вид:

и равен коэффициенту линейной корреляции Пирсона.

Применение данной функции в Excel дает:

коррел =

-0,17198687


 

Очевидно что связь между X и Y практически отсутствует и является обратной.

 

Задание 4. Множественная корреляция

По данным таблицы 11 определить степень взаимосвязи между случайными величинами X1, Х2, Х3, Х4, Х5 и Y, отобразить меры связи в корреляционной матрице; прокомментировать результаты (выполняется с применением режима «Корреляция» пакета «Анализ данных» Microsoft Excel).

Таблица 11

Исходные данные

№п/ п

Страна

Y, х(12)

X1, х(1)

X2, х(2)

X3, х(3)

X4, х(8)

X5, х(11)

1

Австралия

1,38

17 800

15

8

16 848

100

2

Австрия

0,2

8 000

12

11

18 396

99

3

Аргентина

1,3

33 900

20

9

3 408

95

4

Бангладеш

2,4

125 000

35

11

202

35

5

Беларусь

0,32

10 300

13

11

6 500

99

6

Бельгия

0,2

10 100

12

11

17 912

99

7

Бразилия

1,28

156 600

21

9

2 354

81

8

Буркина-Фасо

2,81

10 000

47

18

357

18

9

Великобритания

0,2

58 400

13

11

15 974

99

10

Вьетнам

1,78

73 100

27

8

230

88

11

Гаити

1,63

6 500

40

19

383

53

12

Германия

0,36

81 200

11

11

17 539

99

13

Гондурас

2,73

5 600

35

6

1 030

73

14

Гонконг

-0,09

5 800

13

6

14 641

77

15

Египет

1,95

60 000

29

9

748

48

16

Замбия

2,8

9 100

46

18

573

73

17

Индия

1,9

911 600

29

10

275

52

18

Ирландия

0,3

3 600

14

9

12 170

98

19

Испания

0,25

39 200

11

9

13 047

95

20

Италия

0,21

58 100

11

10

17 500

97

21

Канада

0,7

29100

14

8

19904

97

22

Китай

1,1

1205200

21

7

7

78

23

Колумбия

2

35600

24

6

1538

87

24

Коста-Рика

2,3

3300

26

4

2031

93

25

Куба

0,95

11100

17

7

1382

94

26

Малайзия

2,3

19500

29

5

2995

78

27

Марокко

2,12

28600

29

6

1062

50

28

Мексика

1,9

91800

28

5

3604

87

29

Нидерланды

0,58

15400

13

9

17245

99

30

Новая Зеландия

0,57

3524

16

8

14381

99

31

Норвегия

0,4

4300

13

10

17755

99

32

ОАЭ

4,8

2800

28

3

14193

68

33

Польша

0,3

38600

14

10

4429

99

34

Португалия

0,36

10500

12

10

9000

85

35

Россия

0,2

149200

13

11

6680

99

36

Саудовская Аравия

3,2

18000

38

6

6651

62

37

Северная Корея

1,83

23100

24

6

1000

99

38

Сингапур

1,2

2900

16

6

14990

88

39

США

0,99

260800

15

9

23474

97

40

Таиланд

1,4

59400

19

6

1800

93

41

Турция

2,02

62200

26

6

3721

81

42

Украина

0,05

51800

12

13

2340

97

43

Филиппины

1,92

69800

27

7

867

90

44

Финляндия

0,3

5100

13

10

15877

100


 

Определим степень взаимосвязи между случайными величинами X1, Х2, Х3, Х4, Х5 и Y, отобразим меры связи в корреляционной матрице, полученной с применением режима «Корреляция» пакета «Анализ данных» Microsoft Excel).

Рис. 5 Диалоговое окно режима «Корреляция» пакета «Анализ данных»

 

В результате получим следующую таблицу:

Таблица 12

Расчет степень взаимосвязи между случайными величинами X1, Х2, Х3, Х4, Х5 и Y

 

Y, х(12)

X1, х(1)

X2, х(2)

X3, х(3)

X4, х(8)

X5, х(11)

Y, х(12)

1

         

X1, х(1)

0,012267

1

       

X2, х(2)

0,834368

0,047963

1

     

X3, х(3)

-0,22646

-0,03637

0,193453

1

   

X4, х(8)

-0,49068

-0,21751

-0,664

-0,0299

1

 

X5, х(11)

-0,62933

-0,17894

-0,79862

-0,24411

0,516363

1


 

Из таблицы 12 видно, что между:

Y и X1 – связь очень слабая и прямая

Y и X2 – связь сильная и прямая

Y и X3 – связь слабая и обратная

Y и X4 – связь средняя и обратная

Y и X5 – связь достаточно сильная и обратная

Можно также отметить наличие сильной и обратной связи между X5 и X2.

 

Задание 5. Регрессионный анализ

По данным таблицы 11 построить линейное уравнение регрессии, устанавливающее зависимость между случайной величиной Y (зависимым результативным признаком) и значениями переменных величин Х1, Х2, Х3, Х4, Х5; провести оценку параметров модели; определить границы доверительных интервалов; проверить адекватность принятой математической модели экспериментальным данным (выполняется с применением режимов «Корреляция» и «Регрессия» пакета «Анализ данных» Microsoft Excel).

 

 

 

 

Воспользуемся режимом «Регрессия» пакета «Анализ данных» Microsoft Excel

Рис. 5 Диалоговое окно режима «Регрессия» пакета «Анализ данных»

 

В результате получим следующую таблицу 13:

 

Таблица 13

Расчетные данные

ВЫВОД ИТОГОВ

               
                 

Регрессионная статистика

             

Множественный R

0,933791

             

R-квадрат

0,871965

             

Нормированный R-квадрат

0,855119

             

Стандартная ошибка

0,403541

             

Наблюдения

44

             
                 

Дисперсионный анализ

               
 

df

SS

MS

F

Значимость F

     

Регрессия

5

42,1433794

8,428676

51,7588739

6,17549E-16

     

Остаток

38

6,188111514

0,162845

         

Итого

43

48,33149091

           
                 
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-0,1114

0,740629317

-0,15041

0,88123658

-1,610723854

1,387927

-1,61072

1,387927

X1, х(1)

-6,2E-08

2,95806E-07

-0,2105

0,83440412

-6,61094E-07

5,37E-07

-6,6E-07

5,37E-07

X2, х(2)

0,111473

0,012335781

9,036533

5,2744E-11

0,086500208

0,136445

0,0865

0,136445

X3, х(3)

-0,13111

0,018768192

-6,98556

2,5724E-08

-0,16910056

-0,09311

-0,1691

-0,09311

X4, х(8)

2,62E-05

1,15954E-05

2,263369

0,02940773

2,77101E-06

4,97E-05

2,77E-06

4,97E-05

X5, х(11)

-1,8E-05

0,005417967

-0,00329

0,99739119

-0,010985932

0,01095

-0,01099

0,01095

Информация о работе Контрольная работа по "Статистике"