Линейная парная регрессия

Автор работы: Пользователь скрыл имя, 13 Декабря 2010 в 18:58, реферат

Описание работы

Для точного описания уравнения регрессии необходимо знать условный закон распределения зависимой переменной Y при условии, что переменная Х примет значение х, т.е. Х = х. В статистической практике такую информацию получить, как правило, не удается, так как обычно исследователь располагает лишь выборкой пар значений (xi, yi) ограниченного объема n. В этом случае речь может идти об оценке (приближенном выражении, аппроксимации) по выборке функции регрессии. Такой оценкой является выборочная линия (кривая) регрессии:

= ( x, b0, b1, …, bp) (2)

Файлы: 1 файл

Регрессия, корреляция.doc

— 415.50 Кб (Скачать файл)

  Найдем  t-критерий для ранговой корреляции:

   = 0,556.

  Сравним полученное значение tr с табличным значением  
t0,95; 26 = 2,06. Так как t
r < t0,95; 26, то на уровне значимости 5% принимается гипотеза об отсутствии гетероскедастичности.

  Использование теста Уайта рассмотрим во второй части методических указаний.

Тест  Парка Тест предполагает, что дисперсия остатков связана со значениями факторов функций ln e2 = а + b ln х + и. Проверяется значимость коэффициента регрессии b по t-критерию Стьюдента. Если коэффициент регрессии для уравнения lne2 окажется статистически значимым, то, следовательно, существует зависимость lne2 от lnх, т.е. имеет место гетероскедастичность остатков.

  Чтобы построить зависимость ln e2 = а + b ln х введем замены:  
ln
e2 = у, ln х = z. Построим линейную регрессию у = а + bz. Для этого воспользуемся пакетом анализа Microsoft Excel (Сервис + Анализ данных + + Регрессия). В результате получим следующую модель:

  ln e2 = 5,635 - 0,901 ln х.

  Проверка  уравнения на значимость показывает: R2 = 0,039; F = 1,056; ta = 1,565 и tb = 1,028. По тесту Парка зависимость дисперсии остатков от х проявляется ненадежно: все параметры статистически нее значимы, R2 очень низкий, t-критерий и F-статистика меньше табличных значений (t0,95;26 = 2,06; F0,05;1;26 = 4,23). Тест Парка показал отсутствие гетероскедастичности.

Тест Гейзера

  Тест оценивает зависимость абсолютных значений остатков от значений фактора х в виде функции: |e| = a + bxc, где с задается определенным числом степени. Для нашего примера используем значения с равные -2;-1; -0,5; 0,5; 1;2.

  Для построения моделей регрессий воспользуемся пакетом анализа Microsoft Excel. Получили следующие результаты:

  при с = -2  |e| = 2,62 + 2327,52x-2 R2 = 0,460; F = 22,14

               (5,61) (4,71)

  при с = -1  |e| = 0,87 + 153,09x-1 R2 = 0,360; F = 14,61

               (1,01) (3,82)

  при с = -0,5  |e| = -2,40 + 46,10x-0,5 R2 = 0,271; F = 9,65

                (1,19) (3,11)

  при с = 0,5  |e| = 8,58 - 0,62x0,5 R2 = 0,090; F = 2,56

               (2,76) (1,60)

  при с = 1  |e| = 5,39 - 0,03x R2 = 0,035; F = 0,945

               (2,97) (0,97)

Из теста Гейзера следует, что абсолютная величина остатков достаточно сильно зависит от х-2.

Информация о работе Линейная парная регрессия