Лабораторная работа по «Корреляционный и регрессионный анализ»

Автор работы: Пользователь скрыл имя, 26 Ноября 2017 в 22:55, лабораторная работа

Описание работы

Необходимо сделать:
Постройте поле корреляции и сформулируйте гипотезу о форме связи.
Рассчитайте параметры уравнения линейной, степенной, экспоненциальной, показательной, обратной, гиперболической парной регрессии.
С помощью показателей корреляции и детерминации оцените тесноту связи.
Оцените качество уравнений с помощью средней ошибки аппроксимации.
С помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования, для линейной модели дополнительное исследование по критерию Стьюдента.
Обоснуйте выбор лучшего уравнения регрессии.
Постойте графики уравнений регрессии на поле корреляции.

Файлы: 1 файл

лаба майский .doc

— 4.23 Мб (Скачать файл)

Федеральное государственное бюджетное образовательное учреждение

Высшего профессионального образования

«Уфимский государственный нефтяной технический университет»

 

 

 

Кафедра Математики

 

 

 

Лабораторная работа по дисциплине:

«Корреляционный и регрессионный анализ»

Вариант 7

 

 

 

 

 

 

 

Выполнила:

ст. гр. МАГ02-17-01 Мурзагалиева Г.И.

      Принял:

Майский Р.А.


 

 

 

 

Уфа 2017 г.

Дана таблица:

 

1

2

3

4

5

6

7

8

9

10

х

2,7

2,5

2,9

2,6

2,2

2,8

3,3

3,9

4,0

3,7

у

24,6

21,6

27,0

22,0

24,0

26,5

31,0

33,9

35,0

34,4


 

 

Необходимо сделать:

Постройте поле корреляции и сформулируйте гипотезу о форме связи.

Рассчитайте параметры уравнения линейной, степенной, экспоненциальной, показательной, обратной, гиперболической парной регрессии.

С помощью показателей корреляции и детерминации оцените тесноту связи.

Оцените качество уравнений с помощью средней ошибки аппроксимации.

С помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования, для линейной модели дополнительное исследование по критерию Стьюдента.

Обоснуйте выбор лучшего уравнения регрессии.

Постойте графики уравнений регрессии на поле корреляции.

 

 

 

 

 

 

 

 

Выполнение:

  1. Построим поле корреляции.

Рисунок 1 – Поле корреляции

На основании изученного поля корреляции можно сделать вывод, что характер связи исходных данных будет подчиняться одному из следующих уравнений: уравнению линейной, степенной, экспоненциальной, показательной, обратной, гиперболической парной регрессии. Окончательное решение о принадлежности данных одному из шести уравнений можно будет принять только на основании расчетов, приведенных ниже.

1)Рассчитаем параметры уравнения линейной парной регрессии:

Решим систему уравнений:

* QUOTE * *

Для удобства составляем таблицу с необходимыми для расчета значениями.

 

Таблица 1

x

y

xy

x2

y2

1

2,7

24,6

66,42

7,29

605,16

2

2,5

21,6

54

6,25

466,56

3

2,9

27

78,3

8,41

729

4

2,6

22

57,2

6,76

484

5

2,2

24

52,8

4,84

576

6

2,8

26,5

74,2

7,84

702,25

7

3,3

31

102,3

10,89

961

8

3,9

33,9

132,21

15,21

1149,21

9

4

35

140

16

1225

10

3,7

34,4

127,28

13,69

1183,36

30,6

280

884,71

97,18

8081,54

ср.

3,06

28

88,471

9,718

808,154


 

 

* QUOTE * *

  * QUOTE * *

* QUOTE * *

Исходное уравнение примет вид: * QUOTE * *

Найдем значение уравнения в каждой точке х:

* QUOTE * *

* QUOTE * *

* QUOTE * *

* QUOTE * *

* QUOTE * *

* QUOTE * *

* QUOTE * *

* QUOTE * *

* QUOTE * *

Составляем таблицу 2 с полученными значениями.

Таблица 2

x

y

1

2,7

24,6

25,1642

0,318322

2

2,5

21,6

23,589

3,956121

3

2,9

27

26,7394

0,067912

4

2,6

22

24,3766

5,648228

5

2,2

24

21,2262

7,693966

6

2,8

26,5

25,9518

0,300523

7

3,3

31

29,8898

1,232544

8

3,9

33,9

34,6154

0,511797

9

4

35

35,403

0,162409

10

3,7

34,4

33,0402

1,849056

30,6

280

279,9956

21,74088

ср.

3,06

28

27,9956

2,174088


 

Оценим тесноту связи с помощью показателя корреляции.

* QUOTE * *, где σх – среднеквадратическое отклонение признака х,

                     σу – среднеквадратическое отклонение признака у,

                    b – коэффициент регрессии.

Линейный коэффициент корреляции должен находиться в пределах * QUOTE * *. Коэффициент корреляции оценивает тесноту связи признаков в ее линейной формуле, поэтому близость к 0 по абсолютной величине r не означает отсутствие связи между признаками.

* QUOTE * *

* QUOTE * *

* QUOTE * * – находится в пределах * QUOTE * *.

Оценим тесноту связи с помощью показателя детерминации r2.

r2 = (0,95)2 = 0,9

Показатель детерминации характеризует долю дисперсии результативного признака у, объясняемую регрессией в общей дисперсии результативного признака.  Величина коэффициента детерминации является одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем меньше роль прочих факторов и, следовательно, линейная модель хорошо аппроксимирует исходные данные и ею можно воспользоваться для прогноза значений результативного признака.

Оценим по F-критерию Фишера статистическую надежность результатов регрессионного моделирования.

* QUOTE * *, где r2 – коэффициент детерминации,

                                  n – число статистических данных

* QUOTE * *

Вычисленное значение F признается достоверным, т.е. отличным от 1, если оно больше табличного. В этом случае гипотеза об отсутствии признаков связи отклоняется и делается вывод о существовании этой связи.

Если бы произошла обратная ситуация и вычисленное значение F было бы меньше табличного, то уравнение регрессии приняли бы статистически незначимым. И гипотеза об отсутствии связи не была бы отклонена.

Fтабл  = 5,32

Fфакт = 72

Fфакт < Fтабл   , следовательно, уравнение регрессии принимается статистически незначимым

Исследуем уравнение по критерию Стьюдента

tr факт = 8,5

tr табл = 4,78

tr факт > tr табл  

Таким образом, проверка гипотезы о значимости коэффициентов регрессии и корреляции равносильно проверке гипотезы о значимости линейного уравнения регрессии в целом.

Вычисляем среднюю ошибку аппроксимации:

* QUOTE * *

Ошибка аппроксимации – величина отклонения фактического и расчетного значений результативного признака (* QUOTE * *) по каждому наблюдению. Фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии. Чем меньше эти отличия, тем ближе теоретические значения к эмпирическим данным и тем лучше качество модели. Так как величина ошибки аппроксимации может быть как положительной, так и отрицательной, то ошибку аппроксимации принято определять в процентах по модулю.

 

Рассчитаем параметры уравнения степенной парной регрессии:

Для удобства расчетов нелинейную модель перевели в линейную с помощью соответствующих преобразований.

Решим систему уравнений:

* QUOTE * *

Для удобства составляем таблицу с необходимыми для расчета значениями.

Таблица 3

x

y

X

Y

XY

X2

Y2

1

2,7

24,6

0,993252

3,202746

3,181134

0,986549

10,25758

11,56

2

2,5

21,6

0,916291

3,072693

2,81548

0,839589

9,441444

40,96

3

2,9

27

1,064711

3,295837

3,509113

1,133609

10,86254

1

4

2,6

22

0,955511

3,091042

2,953526

0,913002

9,554543

36

5

2,2

24

0,788457

3,178054

2,50576

0,621665

10,10003

16

6

2,8

26,5

1,029619

3,277145

3,374212

1,060116

10,73968

2,25

7

3,3

31

1,193922

3,433987

4,099914

1,425451

11,79227

9

8

3,9

33,9

1,360977

3,523415

4,795285

1,852257

12,41445

34,81

9

4

35

1,386294

3,555348

4,928759

1,921812

12,6405

49

10

3,7

34,4

1,308333

3,538057

4,628956

1,711735

12,51784

40,96

30,6

280

10,99737

33,16832

36,79214

12,46578

110,3209

241,54

ср

3,06

28

1,099737

3,316832

3,679214

1,246578

20,05834

43,91636

Информация о работе Лабораторная работа по «Корреляционный и регрессионный анализ»