Лабораторная работа по «Корреляционный и регрессионный анализ»
Лабораторная работа, 26 Ноября 2017, автор: пользователь скрыл имя
Описание работы
Необходимо сделать:
Постройте поле корреляции и сформулируйте гипотезу о форме связи.
Рассчитайте параметры уравнения линейной, степенной, экспоненциальной, показательной, обратной, гиперболической парной регрессии.
С помощью показателей корреляции и детерминации оцените тесноту связи.
Оцените качество уравнений с помощью средней ошибки аппроксимации.
С помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования, для линейной модели дополнительное исследование по критерию Стьюдента.
Обоснуйте выбор лучшего уравнения регрессии.
Постойте графики уравнений регрессии на поле корреляции.
Файлы: 1 файл
лаба майский .doc
— 4.23 Мб (Скачать файл)Федеральное государственное бюджетное образовательное учреждение
Высшего профессионального образования
«Уфимский государственный нефтяной технический университет»
Кафедра Математики
Лабораторная работа по дисциплине:
«Корреляционный и регрессионный анализ»
Вариант 7
Выполнила: |
ст. гр. МАГ02-17-01 Мурзагалиева Г.И. |
Принял: |
Майский Р.А. |
Уфа 2017 г.
Дана таблица:
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 | |
х |
2,7 |
2,5 |
2,9 |
2,6 |
2,2 |
2,8 |
3,3 |
3,9 |
4,0 |
3,7 |
у |
24,6 |
21,6 |
27,0 |
22,0 |
24,0 |
26,5 |
31,0 |
33,9 |
35,0 |
34,4 |
Необходимо сделать:
Постройте поле корреляции и сформулируйте гипотезу о форме связи.
Рассчитайте параметры уравнения линейной, степенной, экспоненциальной, показательной, обратной, гиперболической парной регрессии.
С помощью показателей корреляции и детерминации оцените тесноту связи.
Оцените качество уравнений с помощью средней ошибки аппроксимации.
С помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования, для линейной модели дополнительное исследование по критерию Стьюдента.
Обоснуйте выбор лучшего уравнения регрессии.
Постойте графики уравнений регрессии на поле корреляции.
Выполнение:
Построим поле корреляции.
Рисунок 1 – Поле корреляции
На основании изученного поля корреляции можно сделать вывод, что характер связи исходных данных будет подчиняться одному из следующих уравнений: уравнению линейной, степенной, экспоненциальной, показательной, обратной, гиперболической парной регрессии. Окончательное решение о принадлежности данных одному из шести уравнений можно будет принять только на основании расчетов, приведенных ниже.
1)Рассчитаем параметры уравнения линейной парной регрессии:
Решим систему уравнений:
* QUOTE * *
Для удобства составляем таблицу с необходимыми для расчета значениями.
Таблица 1
№ |
x |
y |
xy |
x2 |
y2 |
1 |
2,7 |
24,6 |
66,42 |
7,29 |
605,16 |
2 |
2,5 |
21,6 |
54 |
6,25 |
466,56 |
3 |
2,9 |
27 |
78,3 |
8,41 |
729 |
4 |
2,6 |
22 |
57,2 |
6,76 |
484 |
5 |
2,2 |
24 |
52,8 |
4,84 |
576 |
6 |
2,8 |
26,5 |
74,2 |
7,84 |
702,25 |
7 |
3,3 |
31 |
102,3 |
10,89 |
961 |
8 |
3,9 |
33,9 |
132,21 |
15,21 |
1149,21 |
9 |
4 |
35 |
140 |
16 |
1225 |
10 |
3,7 |
34,4 |
127,28 |
13,69 |
1183,36 |
∑ |
30,6 |
280 |
884,71 |
97,18 |
8081,54 |
ср. |
3,06 |
28 |
88,471 |
9,718 |
808,154 |
* QUOTE * *
* QUOTE * *
* QUOTE * *
Исходное уравнение примет вид: * QUOTE * *
Найдем значение уравнения в каждой точке х:
* QUOTE * *
* QUOTE * *
* QUOTE * *
* QUOTE * *
* QUOTE * *
* QUOTE * *
* QUOTE * *
* QUOTE * *
* QUOTE * *
Составляем таблицу 2 с полученными значениями.
Таблица 2
№ |
x |
y |
||
1 |
2,7 |
24,6 |
25,1642 |
0,318322 |
2 |
2,5 |
21,6 |
23,589 |
3,956121 |
3 |
2,9 |
27 |
26,7394 |
0,067912 |
4 |
2,6 |
22 |
24,3766 |
5,648228 |
5 |
2,2 |
24 |
21,2262 |
7,693966 |
6 |
2,8 |
26,5 |
25,9518 |
0,300523 |
7 |
3,3 |
31 |
29,8898 |
1,232544 |
8 |
3,9 |
33,9 |
34,6154 |
0,511797 |
9 |
4 |
35 |
35,403 |
0,162409 |
10 |
3,7 |
34,4 |
33,0402 |
1,849056 |
∑ |
30,6 |
280 |
279,9956 |
21,74088 |
ср. |
3,06 |
28 |
27,9956 |
2,174088 |
Оценим тесноту связи с помощью показателя корреляции.
* QUOTE * *, где σх – среднеквадратическое отклонение признака х,
σу – среднеквадратическое отклонение признака у,
b – коэффициент регрессии.
Линейный коэффициент корреляции должен находиться в пределах * QUOTE * *. Коэффициент корреляции оценивает тесноту связи признаков в ее линейной формуле, поэтому близость к 0 по абсолютной величине r не означает отсутствие связи между признаками.
* QUOTE * *
* QUOTE * *
* QUOTE * * – находится в пределах * QUOTE * *.
Оценим тесноту связи с помощью показателя детерминации r2.
r2 = (0,95)2 = 0,9
Показатель детерминации характеризует долю дисперсии результативного признака у, объясняемую регрессией в общей дисперсии результативного признака. Величина коэффициента детерминации является одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем меньше роль прочих факторов и, следовательно, линейная модель хорошо аппроксимирует исходные данные и ею можно воспользоваться для прогноза значений результативного признака.
Оценим по F-критерию Фишера статистическую надежность результатов регрессионного моделирования.
* QUOTE * *, где r2 – коэффициент детерминации,
n – число статистических данных
* QUOTE * *
Вычисленное значение F признается достоверным, т.е. отличным от 1, если оно больше табличного. В этом случае гипотеза об отсутствии признаков связи отклоняется и делается вывод о существовании этой связи.
Если бы произошла обратная ситуация и вычисленное значение F было бы меньше табличного, то уравнение регрессии приняли бы статистически незначимым. И гипотеза об отсутствии связи не была бы отклонена.
Fтабл = 5,32
Fфакт = 72
Fфакт < Fтабл , следовательно, уравнение регрессии принимается статистически незначимым
Исследуем уравнение по критерию Стьюдента
tr факт = 8,5
tr табл = 4,78
tr факт > tr табл
Таким образом, проверка гипотезы о значимости коэффициентов регрессии и корреляции равносильно проверке гипотезы о значимости линейного уравнения регрессии в целом.
Вычисляем среднюю ошибку аппроксимации:
* QUOTE * *
Ошибка аппроксимации – величина отклонения фактического и расчетного значений результативного признака (* QUOTE * *) по каждому наблюдению. Фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии. Чем меньше эти отличия, тем ближе теоретические значения к эмпирическим данным и тем лучше качество модели. Так как величина ошибки аппроксимации может быть как положительной, так и отрицательной, то ошибку аппроксимации принято определять в процентах по модулю.
Рассчитаем параметры уравнения степенной парной регрессии:
Для удобства расчетов нелинейную модель перевели в линейную с помощью соответствующих преобразований.
Решим систему уравнений:
* QUOTE * *
Для удобства составляем таблицу с необходимыми для расчета значениями.
Таблица 3
№ |
x |
y |
X |
Y |
XY |
X2 |
Y2 |
|
1 |
2,7 |
24,6 |
0,993252 |
3,202746 |
3,181134 |
0,986549 |
10,25758 |
11,56 |
2 |
2,5 |
21,6 |
0,916291 |
3,072693 |
2,81548 |
0,839589 |
9,441444 |
40,96 |
3 |
2,9 |
27 |
1,064711 |
3,295837 |
3,509113 |
1,133609 |
10,86254 |
1 |
4 |
2,6 |
22 |
0,955511 |
3,091042 |
2,953526 |
0,913002 |
9,554543 |
36 |
5 |
2,2 |
24 |
0,788457 |
3,178054 |
2,50576 |
0,621665 |
10,10003 |
16 |
6 |
2,8 |
26,5 |
1,029619 |
3,277145 |
3,374212 |
1,060116 |
10,73968 |
2,25 |
7 |
3,3 |
31 |
1,193922 |
3,433987 |
4,099914 |
1,425451 |
11,79227 |
9 |
8 |
3,9 |
33,9 |
1,360977 |
3,523415 |
4,795285 |
1,852257 |
12,41445 |
34,81 |
9 |
4 |
35 |
1,386294 |
3,555348 |
4,928759 |
1,921812 |
12,6405 |
49 |
10 |
3,7 |
34,4 |
1,308333 |
3,538057 |
4,628956 |
1,711735 |
12,51784 |
40,96 |
∑ |
30,6 |
280 |
10,99737 |
33,16832 |
36,79214 |
12,46578 |
110,3209 |
241,54 |
ср |
3,06 |
28 |
1,099737 |
3,316832 |
3,679214 |
1,246578 |
20,05834 |
43,91636 |