Методы обнаружения гетероскедастичности

Автор работы: Пользователь скрыл имя, 12 Декабря 2011 в 23:01, курсовая работа

Описание работы

Скедастичность — относительная вариативность, показанная на диаграмме разброса в строках и столбцах разброса.
Виды скедастичности:
Гомоскедастичность или гомогенность дисперсии — состояние, при котором измерения вариативности колеблются внутри диапазона, ожидаемого при случайной вариативности.
Гетероскедастичность — состояние, при котором измерения вариативности являются большими, чем ожидаемые случайно.

Содержание работы

Введение ……………………………………………………...…………..3
Теоретическая часть ………………………………………………………………….4
Практическая часть ………………………………………………………………...16
Заключение ………………………………………………………………...23
Список литературы ………………………

Файлы: 1 файл

Курсовая работа. Мамбетова.doc

— 3.02 Мб (Скачать файл)

      статистика,  рассматривается как случайная  величина и имеет при гипотезе  (т.е. когда действительно =0) стандартное распределение , называемое -распределением Фишера с и степенями свободы ( - число параметров, в нашем случае ).

    Чем больше отношение  , тем больше оснований говорить о том, что переменная действительно помогает в объяснении изменчивости объясняемой переменной . В соответствии с этим, гипотеза отвергается при слишком больших значениях . Соответствующее пороговое значение определяется как квантиль уровня распределения , обозначаемое символом (табличное значение), то есть гипотеза отвергается, если выполняется неравенство:

       

      Методы  обнаружения гетероскедастичности

  1. Тест ранговой корреляции Спирмена

      При проверке полученной модели на возможную  гетероскедастичность данных воспользуемся  тестом ранговой корреляции Спирмена. При выполнении теста ранговой корреляции Спирмена предполагается, что дисперсия  случайной величины будет либо увеличиваться, либо уменьшаться по мере увеличения и поэтому в регрессии, оцениваемой с помощью МНК, абсолютные величины этих остатков и значения будут коррелированы. Данные по и остатки упорядочиваются, и определяем коэффициент ранговой корреляции как

    

где – разность между рангом и рангом, а ранг определяется порядковым номером данных и в порядке возрастания.

    Коэффициент ранговой корреляции имеет нормальное распределение с математическим ожиданием 0 и дисперсией в больших выборках. Следовательно, соответствующая тестовая статистика равна и при использовании двустороннего критерия нулевая гипотеза об отсутствии гетероскедастичности будет отклонена при уровне значимости в 5%, если она превысит 1,96, и при уровне значимости в 1%, если она превысит 2,58.

  1. Тест Голдфелда-Квандта

      Этот  тест применяется в том случае, если ошибки регрессии можно считать  нормально распределенными случайными величинами.

      Предположим, что средние квадратические (стандартные) отклонения возмущений , пропорциональны значениям объясняющей переменной (это означает постоянство часто встречающеюся на практике относительного, а не абсолютного, как в классической модели) разброса возмущений регрессионной модели.

      Упорядочим  наблюдений в порядке возрастания значений регрессора и выберем m первых и m последних наблюдений.

      В этом случае гипотеза о гомоскедастичности будет равносильна тому, что значения , … и , … (т. е. остатки регрессии первых и последних наблюдений) представляют собой выборочные наблюдения нормально распределенных случайных величин, имеющих одинаковые дисперсии.

      Для этого мы сначала упорядочиваем  по возрастанию  и вычисляем и , по формулам:

      

      Далее мы находим  фактическое по формуле:

      

      Если  Fфакт > Fкр, то мы имеем гетероскедастичность;

      Если  Fфакт < Fкр, то мы имеем гомоскедастичность.

      Построение  графика и написание статистических данных.

  1. Тест Глейзера

     Тест  Глейзера раскрывает зависимость между  дисперсиями отклонений σi и значениями переменной xi. Рассмотрим зависимость:

    σi= α+βxγi

     Чтобы использовать данный метод, следует  оценить регрессионную зависимость  γ от х с помощью обычного  МНК, а затем вычислить абсолютные величины остатков ei, оценив их регрессию для данного значения у.

     Можно оценить несколько таких уравнений  регрессии, изменяя значение γ={-1; -0,5; 0; 0,5; 1}. Для каждого γ выполняем регрессионный анализ и находим значение α и β.

     В каждом случае нулевая гипотеза об отсутствии гетероскедастичности будет  отклонена, если оценка β значимо отличается от нуля.

     Если  при оценивании более чем одной функции получается значимая оценка β, то ориентиром при определении характера гетероскедастичности может служить наилучшая из них, т.е. при максимальных значениях α и β. 

      Автокорреляция. Статистика Дарбина  – Уотсона

      Рассмотрим  регрессионную модель временного (динамического) ряда.

      Упорядоченность наблюдений оказывается существенной в том случае, если прослеживается механизм влияния результатов предыдущих наблюдений на результаты последующих. Такие модели называются моделями с  наличием автокорреляции  (сериальной корреляции), на практике ими оказываются именно временные ряды (напомним, что в случае пространственной выборки отсутствие автокорреляции постулируется).

      Графически  положительная автокорреляция выражается в чередовании зон, где наблюдаемые значения оказываются выше объясненных (предсказанных), и зон, где наблюдаемые значения ниже.

      Отрицательная автокорреляция встречается в тех  случаях, когда наблюдения действуют  друг на друга по принципу «маятника» — завышенные значения в предыдущих наблюдениях при водят к занижению их в наблюдениях последующих. Графически это выражается в том, что результаты наблюдений , «слишком часто» «перескакивают» через график объясненной части. Примерное поведение графика наблюдаемых значений временного ряда изображено.

      Как правило, если автокорреляция присутствует, то наибольшее влияние на последующее  наблюдение оказывает результат предыдущего наблюдения. Этот простой критерий (тест Дарбина - Уотсона) определяет наличие автокорреляции между соседними членами. Он основан на простой идее: если корреляция ошибок регрессии не равна нулю, то она присутствует и в остатках регрессии , получающихся в результате применения обычного метода наименьших квадратов. В тесте Дарбина-Уотсона для оценки корреляции используется статистика вида:

      

      Естественно, что в случае отсутствия автокорреляции выборочный коэффициент r окажется не сильно отличающимся от нуля, а значение статистики будет близко к двум. Близость наблюдаемого значения к нулю должна означать наличие положительной автокорреляции, к четырем — отрицательной.

      Тест  Дарбина-Уотсона имеет один существенный недостаток — распределение статистики d зависит не только от числа наблюдений, но и от значений регрессоров . Это означает, что тест Дарбина-Уотсона, не представляет собой статистический критерий, в том смысле, что нельзя указать критическую область, которая позволяла бы отвергнуть гипотезу об отсутствии корреляции, если бы оказалось, что в эту область попало наблюдаемое значение статистики .

      Однако  существуют два пороговых значения и ‚ зависящие только от числа наблюдений, числа регрессоров и уровня значимости, такие, что выполняются следующие условия.

      Если  фактически наблюдаемое значение :

    а) , то гипотеза об отсутствии автокорреляции не отвергается (принимается);

    б) или , то вопрос об отвержении или принятии гипотезы остается открытым (область неопределенности критерия);

    в) ,то принимается альтернативная гипотеза о положительной автокорреляции;

      г) , то принимается альтернативная гипотеза об отрицательной автокорреляции.

Изобразим результат Дарбина—Уотсона графически:

    Для d-статистики найдены верхняя и нижняя границы на уровнях значимости и .

Недостатками  критерия Дарбина—Уотсона является наличие области неопределенности критерия, а также то, что критические значения - статистики определены для объемов выборки не менее 15. Тем не менее, тест Дарбина-Уотсона является наиболее употребляемым.

      Избавление  от автокорреляции, процедура Кохрейна – Оркатта .

    Указанная процедура заключается в том, что, получив методом наименьших квадратов оценочное значение параметра наблюдений и . Далее применяют метод наименьших квадратов к регрессионному уравнению.

      

      

    Избавление:

 

 

    Вычтем  уравнение из другого.

      

    Cделаем замену.

 

, и мы  получаем знакомое нам парное  линейное уравнение.

Информация о работе Методы обнаружения гетероскедастичности