Автор работы: Пользователь скрыл имя, 12 Декабря 2011 в 23:01, курсовая работа
Скедастичность — относительная вариативность, показанная на диаграмме разброса в строках и столбцах разброса.
Виды скедастичности:
Гомоскедастичность или гомогенность дисперсии — состояние, при котором измерения вариативности колеблются внутри диапазона, ожидаемого при случайной вариативности.
Гетероскедастичность — состояние, при котором измерения вариативности являются большими, чем ожидаемые случайно.
Введение ……………………………………………………...…………..3
Теоретическая часть ………………………………………………………………….4
Практическая часть ………………………………………………………………...16
Заключение ………………………………………………………………...23
Список литературы ………………………
.
С
каждой процедурой наши значения уменьшаются
на одно значении (в данной задаче
25 значений после первой попытки
избавиться от автокорреляции у нас
стало 24 значения, а со второй попытки
уже 23). Эта процедура повторяется
вновь и вновь, до тех пор, пока
мы не избавимся от автокорреляции.
Практическая часть
В период с 1959г. по 1983г., население США, имеющее доход (млрд. долл.), затратило на приобретение одежды млрд. долл. Необходимо исследовать и подобрать наилучшую модель зависимости, в которой располагаемый доход зависит от рассматриваемого товара. В рамках подобранной модели проверить гипотезы о том, что:
-
потребление данного товара
-
потребление данного товара
В качестве моделей необходимо рассмотреть и рассчитать параметры следующих функций:
Критерием
построения наилучшей модели использовать
наименьшую среднюю ошибку аппроксимации.
Полученные модели представить графически.
Данные для расчета необходимо взять из
табл. 1.
Потребительские расходы населения США на одежду (млрд. долл.)
Табл. 1
Год | Расход на одежду( ) | Доход ( ) |
1959 | 479,7 | 36,3 |
1960 | 489,7 | 36,6 |
1961 | 503,8 | 37,3 |
1962 | 524,9 | 38,9 |
1963 | 542,3 | 39,6 |
1964 | 580,8 | 42,6 |
1965 | 616,3 | 44,2 |
1966 | 646,8 | 46,9 |
1967 | 673,5 | 46,9 |
1968 | 701,3 | 49 |
1969 | 722,5 | 50 |
1970 | 751,6 | 49,4 |
1971 | 779,2 | 51,8 |
1972 | 810,3 | 55,4 |
1973 | 865,3 | 59,3 |
1974 | 858,4 | 58,7 |
1975 | 875,8 | 60,9 |
1976 | 906,8 | 63,8 |
1977 | 942,9 | 67,5 |
1978 | 988,8 | 73,6 |
1979 | 1015,5 | 76,7 |
1980 | 1021,6 | 77,9 |
1981 | 1049,3 | 82,6 |
1982 | 1058,3 | 84,2 |
1983 | 1095,4 | 88,5 |
Вычисляем параметры линейной регрессии:
β= ;
α .
Уравнение линейной регрессии имеет вид:
ŷ=α+βх=98,27+12,01x.
Рассчитаем параметры, характеризующие качество выявленной зависимости дохода и потребления:
.
Определим , который поможет нам определить правдивость хорошей линейной зависимости между доходом и потреблением имеющихся статистических данных.
где - табличное значение критерий Фишера ( . Выполнив вычисления, мы определили Rкр2(1%) = 0,25, Rкр2(5%)=16. Мы видим, что – коэффициент детерминации больше критического значения – это говорит нам, что коэффициент детерминации хороший и наша модель приемлема для дальнейшего исследования.
Данные
параметры характеризуют
Рис. 1. Линейная функция
Примечание: прямая линия – уравнение регрессии, а точки статистические данные.
Доверительный интервал для параметров и находим из неравенства:
Здесь - вероятность или уровень доверия; - квантиль -распределения Стьюдента с степенями свободы; - число параметров, в нашем случае он равен 2; и оценки исследуемых параметров, полученные ранее с использованием метода наименьших квадратов (МНК); - несмещенные оценки для дисперсий случайных величин и - уровень значимости.
Квантиль -распределения Стьюдента с 23-мя степенями свободы и находим из таблицы: , а для : .
Оценки находим по формулам:
Таким образом, Sα=0,69 и Sβ=0,07 получаем доверительные интервалы с вероятностью равной 1%:
96,84 ≤ αсл ≤ 99,69; 11,86 ≤ βсл ≤ 12,17.
С вероятностью равной 5%:
96,33 ≤ αсл ≤ 100,21; 11,8 ≤ βсл ≤ 12,23.
При проверке полученной модели на возможную гетероскедастичность данных воспользуемся тестом ранговой корреляции Спирмена. При выполнении теста ранговой корреляции Спирмена предполагается, что дисперсия случайной величины будет либо увеличиваться, либо уменьшаться по мере увеличения и поэтому в регрессии, оцениваемой с помощью МНК, абсолютные величины этих остатков и значения будут коррелированны. Данные по и остатки упорядочиваются, определяем коэффициент ранговой корреляции как
где – разность между рангом и рангом, а ранг определяется порядковым номером данных и в порядке возрастания.
Коэффициент ранговой корреляции имеет нормальное распределение с математическим ожиданием 0 и дисперсией в больших выборках. Следовательно, соответствующая тестовая статистика равна и при использовании двустороннего критерия нулевая гипотеза об отсутствии гетероскедастичности будет отклонена при уровне значимости в 5%, если она превысит 1,96, и при уровне значимости в 1%, если она превысит 2,58.
Сумма квадратов составила 2930, а коэффициент ранговой корреляции равен 0,22 и тестовая статистика составляет 1,08, что меньше, чем 1,96. Следовательно, нулевая гипотеза об отсутствии гетероскедастичности при пяти -, а тем более и однопроцентном уровне значимости принимается, тем самым мы отклоняем факт наличия у данных свойства гетероскедастичности.
Сделаем проверку о факте исключения у данных свойства гетероскедастичности с помощью теста Голдфелда-Квандта. Анализируем данные, то есть, выполняем регрессионный анализ. Анализируем столбец RSS (упорядочиваем данные по этому столбцу по возрастанию). Берем из столбца RSS первые 11 значений и последние 11 значений.
Будем рассматривать соотношение . Сравниваем с . . Если , то гипотеза (о наличии гетероскедастичности) отвергается, следовательно, данные являются гомоскедастичными. RSS1=18963,25; RSS2=22108,61. Следовательно, Fфакт=0,86, что говорит об отсутствии у данных наличия гетероскедастичности.
Для проверки факта наличия положительной автокоррелированности ошибок используем критерий Дарбина-Уотсона. По таблицам находим нижнюю границу для критического значения при : , при : . Полученное при оценивании модели значение DW = 1,60, существенно меньше нижней границы, так что гипотеза - о независимости ошибок в модели отвергается в пользу альтернативной гипотезы – о наличии автокоррелированности ошибок. Для коррекции модели и избавления от автокоррелированности ошибок, используем процедуру Кохрейна-Оркатта и находим оценку коэффициента
Из уравнения линейной модели вычитаем уравнение умноженное на . В результате получаем преобразованную модель , где . Здесь ; , при ; .
Преобразуя исходные данные ( и ) по этим формулам получаем новые исходные данные при , число которых на единицу меньше. Основываясь на них, выполняем регрессионный анализ и переходим к преобразованной модели, оценивание которой дает результаты DW=1,60.
Хотя в преобразованной модели коэффициент детерминации существенно ниже, чем в первоначальной модели, значение статистики Дарбина-Уотсона теперь превышает верхнюю границу для критического значения , соответствующего . Поэтому гипотеза о независимости ошибок в преобразованной модели не отвергается (в пользу гипотезы о наличии автокоррелированности).
Определяем параметры линейной регрессии:
Уравнение линейной регрессии имеет вид: Ŷ=A+B∙X=1508,88-38365,36∙X. Для дальнейшего анализа гиперболической функции необходимо выполнить обратное преобразование, то есть:
Подставляя
в последнее уравнение наши статистические
данные
получаем
оцененные значения
. По этим данным
определяем среднюю ошибку аппроксимации
равную A=0,52%, что говорит не в пользу гиперболической
функции перед линейной функцией. Для
наглядности представим результаты графически
(рис. 2).
Рис.
2. Гиперболическая функция
Заключение