Автор работы: Пользователь скрыл имя, 06 Мая 2013 в 00:30, контрольная работа
Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Рассчитайте параметры линейной парной регрессии для каждого фактора Х, наиболее тесно связанного с Y .
Оцените качество модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера.
Для выбранной модели осуществите прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора составит 80% от его максимального значения. Представьте графически: фактические и модельные значения, точки прогноза.
Таблица 6
Результаты регрессионного анализа для факторного признака X3
Регрессионная статистика | |
Множественный R |
0,892251 |
R-квадрат |
0,796112 |
Нормированный R-квадрат |
0,790747 |
Стандартная ошибка |
26,20741 |
Наблюдения |
40 |
Дисперсионный анализ | ||||||||
df |
SS |
MS |
F |
Значимость F | ||||
Регрессия |
1 |
101909,516 |
101909,516 |
148,377 |
1,08E-14 | |||
Остаток |
38 |
26099,47772 |
686,828361 |
|||||
Итого |
39 |
128008,9938 |
||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |||||
Y-пересечение |
-14,8883 |
10,39497402 |
-1,432262319 |
0,160244 | ||||
X3 |
1,592401 |
0,130728155 |
12,18100887 |
1,08E-14 |
Вывод: , , то есть уравнение линейной парной регрессии для фактора Х3 имеет вид: Y = -14,888 + 1,592·X3.
Коэффициент показывает, что, если не учитывать влияние территориального фактора и этажности квартир на цену, то с увеличением общей площади квартиры на 1 кв.метр, стоимость квартиры увеличится на 1,592 тыс. долл.
Значение параметра <0 не имеет экономического смысла, однако соответствует опережению изменения результата Y над изменением признака X3.
Результаты регрессионного анализа для факторного признака X5
Регрессионная статистика | |
Множественный R |
0,071385 |
R-квадрат |
0,005096 |
Нормированный R-квадрат |
-0,02109 |
Стандартная ошибка |
57,89207 |
Наблюдения |
40 |
Дисперсионный анализ | ||||||||
df |
SS |
MS |
F |
Значимость F | ||||
Регрессия |
1 |
652,3174 |
652,3174 |
0,194635 |
0,661587 | |||
Остаток |
38 |
127356,7 |
3351,491 |
|||||
Итого |
39 |
128009 |
||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |||||
Y-пересечение |
107,3669 |
16,63769 |
6,453235 |
1,36E-07 | ||||
X5 |
-1,08967 |
2,46993 |
-0,441175 |
0,661587 |
Вывод: , , то есть уравнение линейной парной регрессии для фактора Х5 имеет вид: Y = 107,367 – 1,089·X5.
Коэффициент показывает, что чем выше этаж квартиры на 1 единицу цена квартиры уменьшается на 1,089 тыс. долл. То, что , не имеет экономического смысла, однако положительный знак параметра свидетельствует о том, что относительное изменение результата Y происходит медленнее, чем изменение признака X5.
4. Оценка качества каждой модели через коэффициент детерминации, средней ошибки аппроксимации и F-критерия Фишера.
1) Для оценки качества
подбора линейной функции
где - сумма квадратов отклонений, объясненная регрессией, и общая сумма квадратов отклонений соответственно.
R2 > 0.5 соответствует высокой степени тесноты связи признаков в уравнении регрессии. При этом более 50% вариаций расчетных значений признака Y объясняется влиянием фактора X, что позволяет применение полученного уравнения регрессии правомерным.
Коэффициенты детерминации были получены в результате расчетов, проведенных в пункте 3 и представлены в таблицах 5-7 (в программе Excel коэффициент детерминации обозначается, как R-квадрат).
= 0,000127 – неприемлемая модель,
= 0,7961 – использование модели правомерно,
= 0,005096 – неприемлемая модель.
Вывод: Исходя из этого критерия, наиболее адекватной является модель уравнения регрессии зависимости цены квартиры от жилой площади Y = f(Х3).
2) Также для оценки
точности регрессионных
. (6)
Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше ошибка аппроксимации. Ошибка аппроксимации менее 7% свидетельствует о хорошем качестве модели. Модель считается приемлемой, если средняя ошибка аппроксимации меньше 15%.
Для расчета средней ошибки аппроксимации по формуле 6 также можно воспользоваться инструментом Регрессия, входящим в настойку Анализ данных, при этом следует установить флажок Остатки в окне Параметров вывода. В результате получается таблица ВЫВОД ОСТАТКА. Итоговая таблица остатков ( ) для всех признаков выглядит следующим образом:
Таблица 8.
Вспомогательная таблица для расчета средней ошибки аппроксимации.
Наблю-дение |
Y |
Остатки, εi (X1) |
Остатки, εi (X3) |
Остатки, εi (X5) |
|||
1 |
38 |
-62,533 |
-13,833 |
-56,290 |
4,114 |
0,910 |
3,703 |
2 |
62 |
-38,333 |
-32,787 |
-35,359 |
1,541 |
1,322 |
1,426 |
3 |
125 |
23,186 |
33,197 |
29,619 |
0,464 |
0,663 |
0,592 |
4 |
61 |
-39,433 |
-16,530 |
-35,370 |
1,613 |
0,677 |
1,449 |
5 |
67 |
-34,814 |
30,931 |
-38,188 |
1,299 |
1,154 |
1,425 |
6 |
93 |
-8,814 |
16,803 |
-13,277 |
0,237 |
0,452 |
0,357 |
7 |
118 |
17,467 |
-37,498 |
12,812 |
0,370 |
0,794 |
0,271 |
8 |
132 |
30,186 |
17,904 |
33,350 |
0,572 |
0,339 |
0,632 |
9 |
93 |
-9,314 |
-35,769 |
-5,059 |
0,252 |
0,962 |
0,136 |
10 |
105 |
4,467 |
0,458 |
6,351 |
0,106 |
0,011 |
0,151 |
11 |
42 |
-58,533 |
-0,438 |
-56,649 |
3,484 |
0,026 |
3,372 |
12 |
125 |
24,467 |
23,802 |
35,068 |
0,489 |
0,476 |
0,701 |
13 |
170 |
68,186 |
41,572 |
65,902 |
1,003 |
0,611 |
0,969 |
14 |
38 |
-63,814 |
6,708 |
-66,098 |
4,198 |
0,441 |
4,349 |
15 |
131 |
28,686 |
-26,591 |
24,223 |
0,550 |
0,507 |
0,462 |
16 |
85 |
-16,814 |
4,344 |
-19,098 |
0,495 |
0,128 |
0,562 |
17 |
98 |
-3,814 |
-14,504 |
-6,098 |
0,097 |
0,37 |
0,156 |
18 |
128 |
26,186 |
-22,721 |
24,992 |
0,511 |
0,444 |
0,488 |
19 |
85 |
-16,814 |
-35,466 |
-13,649 |
0,495 |
1,043 |
0,401 |
20 |
160 |
59,467 |
63,420 |
54,812 |
0,929 |
0,991 |
0,856 |
21 |
60 |
-41,814 |
-20,656 |
-43,008 |
1,742 |
0,861 |
1,792 |
22 |
41 |
-59,533 |
0,154 |
-55,470 |
3,630 |
0,009 |
3,382 |
23 |
90 |
-10,533 |
-14,542 |
-11,919 |
0,293 |
0,404 |
0,331 |
24 |
83 |
-18,814 |
-12,784 |
-23,277 |
0,567 |
0,385 |
0,701 |
25 |
45 |
-56,814 |
7,657 |
-59,098 |
3,156 |
0,425 |
3,283 |
26 |
39 |
-62,814 |
2,932 |
-65,098 |
4,027 |
0,188 |
4,173 |
27 |
87 |
-14,914 |
-52,675 |
-9,570 |
0,429 |
1,514 |
0,275 |
28 |
40 |
-61,814 |
2,658 |
-65,188 |
3,863 |
0,166 |
4,074 |
29 |
80 |
-21,814 |
-18,649 |
-25,188 |
0,682 |
0,583 |
0,787 |
30 |
227 |
125,186 |
7,805 |
121,812 |
1,379 |
0,086 |
1,342 |
31 |
235 |
133,186 |
11,028 |
137,440 |
1,417 |
0,117 |
1,462 |
32 |
40 |
-60,533 |
0,747 |
-58,649 |
3,783 |
0,047 |
3,666 |
33 |
67 |
-33,533 |
7,046 |
-39,277 |
1,251 |
0,262 |
1,466 |
34 |
123 |
22,467 |
8,904 |
25,440 |
0,457 |
0,181 |
0,517 |
35 |
100 |
-1,814 |
24,121 |
-0,829 |
0,045 |
0,603 |
0,021 |
36 |
105 |
4,467 |
-7,504 |
0,902 |
0,106 |
0,179 |
0,021 |
37 |
70 |
-30,233 |
-7,330 |
-26,170 |
1,075 |
0,262 |
0,935 |
38 |
82 |
-18,533 |
-32,255 |
-19,919 |
0,565 |
0,983 |
0,607 |
39 |
280 |
179,467 |
48,066 |
178,082 |
1,602 |
0,429 |
1,590 |
40 |
200 |
99,467 |
42,272 |
96,992 |
1,243 |
0,528 |
1,212 |
Итого: |
54,132 |
20,533 |
54,095 |
Для расчета используется функция Excel ЗНАК, которая возвращает знак числа (1 – положительное число, -1 – отрицательное число), таким образом, может применяться для расчетов с модулем. Полученные в строке Итоги таблицы 8 значения соответствуют средним ошибкам аппроксимации:
= 54,13 % - неприемлемая модель;
= 20,53 % - неприемлемая модель;
= 54,09 % - неприемлемая модель.
Вывод: Ни одну из моделей по данному критерию оценки считать приемлемой нельзя. Лучшей моделью является зависимость цены квартиры от общей площади квартиры Y = f(Х3).
3) Для проверки значимости модели регрессии используется F-критерий Фишера. Для этого выполняется сравнение и критического (табличного) значений F-критерия Фишера.
Расчетные значения приведены в таблицах 5-7 (обозначены буквой F).
Табличное значение F-критерий Фишера, рассчитанное в Excel с помощью функции FРАСПОБР (вероятность равна 0,05, число степеней свободы - 1 и 38): = 4,10.
Расчетные значения F-критерий Фишера для каждого фактора сравнивается с табличным значением:
= 0,005 < = 4,10 - модель по данному критерию незначима;
= 148,38 > = 4,10 - модель по данному критерию значима;
= 0,19 < = 4,10 - модель по данному критерию незначима.
Вывод: Проанализировав данные по всем трем критериям, можно сделать вывод, что наиболее лучшей является математическая модель, построена для фактора общая площадь квартиры, которая описана линейным уравнением Y = – 14,89 + 1,59·X3.
5.
Прогнозирование среднего значе
Для прогнозирования среднего значения показателя Y наиболее качественная модель Y = – 14,89+ 1,59·X3.
Для расчета прогнозного значения Х3пр определяется максимальное значение фактора Х3max (по условию Х3пр составит 80% от Х3max) в Excel с помощью функции МАКС:
= 155 кв.м.
Следовательно, Х3пр = 0,8·155 = 124 кв.м.
В прогнозных расчетах по уравнения регрессии определяется предсказываемое значение как точечный прогноз :
= – 14,89 + 1,59·124 = 182,27 тыс.долл.
Точечный прогноз не реален, поэтому он дополняется доверительным и соответственно интервальной оценкой прогнозного значения Y*:
,
где , - значение стандартной ошибки из таблицы 7, - табличное значение t-критерия Стьюдента.
Для расчета коэффициента используется функцией Excel СТЬЮДРАСПОБР, вероятность возьмем равную 0.1, число степеней свободы - 38. рассчитывается с помощью функции СРЗНАЧ. Значение определяется также с помощью Excel. Таким образом:
= 1.686;
= 26,2074;
= 72,925;
=401890,255.
Следовательно, .
Определим верхнюю и нижнюю границы интервала:
= 182,27 – 1,686 · 7,858 = 169,021 тыс. долл.;
= 182,27 + 1,686 · 7,858 = 195,519 тыс. долл.
Вывод: Прогнозное значение тыс. долл. будет находиться между нижней границей, равной 169,021тыс. долл. и верхней границей, равной 195,519 тыс.долл. (т.е. ). Таким образом, если общая площадь квартиры увеличится на 80% от максимального значения и составит 124 кв. м., то ожидаемая средняя цена квартиры будет от 169,02 тыс. долл. до 195,52 тыс. долл.
Графическое изображение фактических и модельных значений, точка прогноза представлено на рисунке 2.
Рисунок 2. Графическое изображение фактических и модельных значений, точки прогноза.
6. Построение модели формирования цены квартиры за счёт значимых факторов с использованием множественной регрессию.
Метод исключения. Для построения модели множественной регрессии необходимо воспользоваться функцией Регрессия программы Excel, включив в нее все факторы. В результате получается результативные таблицы.
Таблица 9
Результаты регрессионного анализа для всех факторов вместе
Регрессионная статистика | |
Множественный R |
0,89486 |
R-квадрат |
0,800774 |
Нормированный R-квадрат |
0,784172 |
Стандартная ошибка |
26,61596 |
Наблюдения |
40 |
Дисперсионный анализ | |||||||||
df |
SS |
MS |
F |
Значимость F | |||||
Регрессия |
3 |
102506,2501 |
34168,75 |
48,23305 |
1,08E-12 | ||||
Остаток |
36 |
25502,74367 |
708,4095 |
||||||
Итого |
39 |
128008,9938 |
|||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | ||||||
Y-пересечение |
-11,9275 |
12,64119155 |
-0,94354 |
0,351694 | |||||
X1 |
5,877772 |
9,033758721 |
0,650645 |
0,519407 | |||||
X3 |
1,593441 |
0,132906834 |
11,98916 |
3,95E-14 | |||||
X5 |
-1,01008 |
1,211898319 |
-0,83347 |
0,410076 |