Методы обнаружения гетероскедастичности

Автор работы: Пользователь скрыл имя, 12 Декабря 2011 в 23:01, курсовая работа

Описание работы

Скедастичность — относительная вариативность, показанная на диаграмме разброса в строках и столбцах разброса.
Виды скедастичности:
Гомоскедастичность или гомогенность дисперсии — состояние, при котором измерения вариативности колеблются внутри диапазона, ожидаемого при случайной вариативности.
Гетероскедастичность — состояние, при котором измерения вариативности являются большими, чем ожидаемые случайно.

Содержание работы

Введение ……………………………………………………...…………..3
Теоретическая часть ………………………………………………………………….4
Практическая часть ………………………………………………………………...16
Заключение ………………………………………………………………...23
Список литературы ………………………

Файлы: 1 файл

Курсовая работа. Мамбетова.doc

— 3.02 Мб (Скачать файл)

 

 

.

      С каждой процедурой наши значения уменьшаются  на одно значении   (в данной задаче 25 значений после первой попытки  избавиться от автокорреляции у нас  стало 24 значения, а со второй попытки  уже 23). Эта процедура повторяется  вновь и вновь, до тех пор, пока мы не избавимся от автокорреляции.  

 

Практическая  часть

    В период с 1959г. по 1983г., население США, имеющее доход  (млрд. долл.), затратило на приобретение одежды   млрд. долл. Необходимо исследовать и подобрать наилучшую модель зависимости, в которой располагаемый доход зависит от рассматриваемого товара. В рамках подобранной модели проверить гипотезы о том, что:

    - потребление данного товара эластично  по отношению к доходу;

    - потребление данного товара неэластично  по отношению к доходу.

    В качестве моделей необходимо рассмотреть  и рассчитать параметры следующих  функций:

  1. Линейной;
  2. Гиперболической.

    Критерием построения наилучшей модели использовать наименьшую среднюю ошибку аппроксимации. Полученные модели представить графически. Данные для расчета необходимо взять из табл. 1. 

    Потребительские расходы населения США на одежду (млрд. долл.)

    Табл. 1

Год Расход на одежду( ) Доход ( )
1959 479,7 36,3
1960 489,7 36,6
1961 503,8 37,3
1962 524,9 38,9
1963 542,3 39,6
1964 580,8 42,6
1965 616,3 44,2
1966 646,8 46,9
1967 673,5 46,9
1968 701,3 49
1969 722,5 50
1970 751,6 49,4
1971 779,2 51,8
1972 810,3 55,4
1973 865,3 59,3
1974 858,4 58,7
1975 875,8 60,9
1976 906,8 63,8
1977 942,9 67,5
1978 988,8 73,6
1979 1015,5 76,7
1980 1021,6 77,9
1981 1049,3 82,6
1982 1058,3 84,2
1983 1095,4 88,5
  1. Для построения линейной модели используем данные табл. 2.

    Вычисляем параметры линейной регрессии:

     β= ;

     α .

    Уравнение линейной регрессии имеет вид:

    ŷ=α+βх=98,27+12,01x.

    Рассчитаем  параметры, характеризующие качество выявленной зависимости дохода и  потребления:

     

      .

    Определим , который поможет нам определить правдивость хорошей линейной зависимости между доходом и потреблением имеющихся статистических данных.

    

где - табличное значение критерий Фишера ( . Выполнив вычисления, мы определили Rкр2(1%) = 0,25, Rкр2(5%)=16. Мы видим, что – коэффициент детерминации больше критического значения – это говорит нам, что коэффициент детерминации хороший и наша модель приемлема для дальнейшего исследования.

    Данные  параметры характеризуют хорошую  линейную зависимость между доходом  и потреблением на имеющихся статистических данных. Найденная средняя ошибка аппроксимации составляет величину А=1,24% , что говорит в пользу линейной зависимости дохода и потребления. Для наглядности представим результаты графически (рис. 1). 

    Рис. 1. Линейная функция

    

    Примечание: прямая линия – уравнение регрессии, а точки статистические данные.

    Доверительный интервал для параметров и находим из неравенства:

    

    

    Здесь - вероятность или уровень доверия; - квантиль -распределения Стьюдента с степенями свободы; - число параметров, в нашем случае он равен 2; и оценки исследуемых параметров, полученные ранее с использованием метода наименьших квадратов (МНК); - несмещенные оценки для дисперсий случайных величин и - уровень значимости.

    Квантиль -распределения Стьюдента с 23-мя степенями свободы и  находим из таблицы: , а для : .

    Оценки  находим по формулам:

    

    Таким образом, Sα=0,69 и Sβ=0,07 получаем доверительные интервалы с вероятностью равной 1%:

    96,84 ≤ αсл ≤ 99,69; 11,86 ≤ βсл ≤ 12,17.

    С вероятностью равной 5%:

    96,33 ≤ αсл ≤ 100,21; 11,8 ≤ βсл ≤ 12,23.

    При проверке полученной модели на возможную  гетероскедастичность данных воспользуемся  тестом ранговой корреляции Спирмена. При выполнении теста ранговой корреляции Спирмена предполагается, что дисперсия  случайной величины будет либо увеличиваться, либо уменьшаться по мере увеличения и поэтому в регрессии, оцениваемой с помощью МНК, абсолютные величины этих остатков и значения будут коррелированны. Данные по и остатки упорядочиваются, определяем коэффициент ранговой корреляции как

    

где – разность между рангом и рангом, а ранг определяется порядковым номером данных и в порядке возрастания.

    Коэффициент ранговой корреляции имеет нормальное распределение с математическим ожиданием 0 и дисперсией в больших выборках. Следовательно, соответствующая тестовая статистика равна и при использовании двустороннего критерия нулевая гипотеза об отсутствии гетероскедастичности будет отклонена при уровне значимости в 5%, если она превысит 1,96, и при уровне значимости в 1%, если она превысит 2,58.

    Сумма квадратов  составила 2930, а коэффициент ранговой корреляции равен 0,22 и тестовая статистика составляет 1,08, что меньше, чем 1,96. Следовательно, нулевая гипотеза об отсутствии гетероскедастичности при пяти -, а тем более и однопроцентном уровне значимости принимается, тем самым мы отклоняем факт наличия у данных свойства гетероскедастичности.

    Сделаем проверку о факте исключения у  данных свойства гетероскедастичности с помощью теста Голдфелда-Квандта. Анализируем данные, то есть, выполняем регрессионный анализ. Анализируем столбец RSS (упорядочиваем данные по этому столбцу по возрастанию). Берем из столбца RSS первые 11 значений и последние 11 значений.

    

    Будем рассматривать соотношение  . Сравниваем с . . Если , то гипотеза (о наличии гетероскедастичности) отвергается, следовательно, данные являются гомоскедастичными. RSS1=18963,25; RSS2=22108,61. Следовательно, Fфакт=0,86, что говорит об отсутствии у данных наличия гетероскедастичности.

    Для проверки факта наличия положительной  автокоррелированности ошибок используем критерий Дарбина-Уотсона. По таблицам находим нижнюю границу для критического значения при : при : . Полученное при оценивании модели значение DW = 1,60, существенно меньше нижней границы, так что гипотеза - о независимости ошибок в модели отвергается в пользу альтернативной гипотезы – о наличии автокоррелированности ошибок. Для коррекции модели и избавления от автокоррелированности ошибок, используем процедуру Кохрейна-Оркатта и находим оценку коэффициента

      

    Из  уравнения линейной модели вычитаем уравнение умноженное на . В результате получаем преобразованную модель , где . Здесь ; , при ; .

    Преобразуя  исходные данные ( и ) по этим формулам получаем новые исходные данные при , число которых на единицу меньше. Основываясь на них, выполняем регрессионный анализ и переходим к преобразованной модели, оценивание которой дает результаты DW=1,60.

    Хотя  в преобразованной модели коэффициент  детерминации существенно ниже, чем  в первоначальной модели, значение статистики Дарбина-Уотсона теперь превышает верхнюю границу для  критического значения , соответствующего . Поэтому гипотеза о независимости ошибок в преобразованной модели не отвергается (в пользу гипотезы о наличии автокоррелированности).

  1. Для построения гиперболической модели зависимости потребления от дохода вида необходимо привести ее к линейному виду с помощью преобразования . Производя замены получим уравнение , которое является уже линейным уравнением и его можно решить по аналогии с примером 1.

    Определяем параметры линейной регрессии:

    

    

    Уравнение линейной регрессии имеет вид: Ŷ=A+B∙X=1508,88-38365,36∙X. Для дальнейшего анализа гиперболической функции необходимо выполнить обратное преобразование, то есть:

    

    Подставляя  в последнее уравнение наши статистические данные получаем оцененные значения . По этим данным определяем среднюю ошибку аппроксимации равную A=0,52%, что говорит не в пользу гиперболической функции перед линейной функцией. Для наглядности представим результаты графически (рис. 2). 

    Рис. 2. Гиперболическая функция 

           

 

    Заключение

Информация о работе Методы обнаружения гетероскедастичности