Шпаргалка по "Эконометрика"

Автор работы: Пользователь скрыл имя, 20 Февраля 2012 в 23:45, шпаргалка

Описание работы

Работа содержит ответы на вопросы по дисциплине "Эконометрика".

Файлы: 1 файл

Ekonometrika.docx

— 343.76 Кб (Скачать файл)

Метод максимального  правдоподобия соответствует многим известным методам оценки в области  статистики. Например, предположим, что  вы заинтересованы ростом жителей Украины. Предположим, у вас данные роста  некоторого количества людей, а не всего  населения. Кроме того предполагается, что рост является нормально распределенной величиной с неизвестной дисперсией и средним значением. Среднее  значение и дисперсия роста выборки  является максимально правдоподобным к среднему значению и дисперсии  всего населения.

Для фиксированного набора данных и базовой вероятностной  модели, используя метод максимального  правдоподобия, мы получим значения параметров модели, которые делают данные «более близкими» к реальным. Оценка максимального правдоподобия  дает уникальный и простой способ определить решения в случае нормального  распределения.

Метод оценки максимального  правдоподобия применяется для  широкого круга статистических моделей, в том числе:

линейные модели и обобщенные линейные модели;

факторный анализ;

моделирования структурных уравнений;

многие ситуации, в рамках проверки гипотезы и доверительного интервала формирования;

дискретные модели выбора 

17. показатель тесноты  связи

Уравнение регрессии  всегда дополняется показателем  тесноты связи. При использовании  линейной регрессии в качестве такого показателя выступает линейный коэффициент  корреляции rxy, который можно рассчитать по следующим формулам:  

Линейный коэффициент  корреляции находится в пределах: -1£rxy£1.

Если r>0, то прямая связь

Если r<0, то обратная связь

Если |r|³0,7, то сильная  связь

Если 0,5£|r|<0,7, то умеренная связь

Если |r|<0,5, то слабая связь

Если b>0, то 0£rxy£1, если b<0, то -1£rxy£0.

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Коэффициент детерминации показывает сколько процентов приходится на долю учтенных в модели факторов:

Соответственно  величина характеризует долю дисперсии y, вызванную влиянием остальных, не учтенных в модели, факторов. 

18.Автокорреляция 
 
АВТОКОРРЕЛЯЦИЯ [autocorrelation, serial correlation] — корреляционная связь (см. Корреляция) между значениями одного и того же случайного процесса X (t) в моменты времени t1 и t2. Функция, характеризующая эту связь, называется автокорреляционной функцией. 
 
При анализе временных рядов автокорреляционная функция характеризует внутреннюю зависимость между временным рядом и тем же рядом, но сдвинутым на некоторый промежуток времени (сдвиг). Иначе говоря, это корреляция членов ряда и передвинутых на L единиц времени членов того же ряда: x1, x2, x3, ... и x1+L, x2+L, x3+L, ... Запаздывание L называется лагом и является положительным целым числом. В некоторых работах А. определяется как корреляционная зависимость между соседними значениями уровней временного ряда. 
 
Наличие А. затрудняет применение ряда классических методов анализа временных рядов. В моделях регрессии, описывающих зависимости между случайными значениями взаимосвязанных величин, она снижает эффективность применения метода наименьших квадратов. Поэтому выработаны и применяются специальные статистические приемы для ее выявления (напр., критерий Дарбина — Уотсона) и элиминирования (напр., преобразование временного ряда в ряд значений разностей между его соседними членами), а также для модификации самого метода наименьших квадратов.
 

19.для чего используют критерий дарбина-уотсона

Критерий Дарбина  — Уотсона (или DW-критерий) — статистический критерий, используемый для нахождения автокорреляции первого порядка элементов исследуемой последовательности. Наиболее часто применяется при анализе временных рядов и остатков регрессионных моделей. Критерий назван в честь Джеймса Дарбина и Джеффри Уотсона. Критерий Дарбина — Уотсона рассчитывается по следующей формуле[1][2]:

где ρ1 — коэффициент автокорреляции первого порядка.

В случае отсутствия автокорреляции d = 2, при положительной автокорреляции d стремится к нулю, а при отрицательной — к 4:

На практике применение критерия Дарбина — Уотсона  основано на сравнении величины d с теоретическими значениями dL и dU для заданных числа наблюдений n, числа независимых переменных модели k и уровня значимости α.

Если d<dL, то гипотеза о независимости случайных отклонений отвергается (следовательно присутствует положительная автокорреляция);

Если d>dU, то гипотеза не отвергается;

Если dL<d<dU, то нет достаточных оснований для принятия решений.

Когда расчетное  значение d превышает 2, то с dL и dU сравнивается не сам коэффициент d, а выражение (4 − d)

Также с помощью  данного критерия выявляют наличие  коинтеграции между двумя временными рядами. В этом случае проверяют  гипотезу о том, что фактическое  значение критерия равно нулю. С  помощью метода Монте-Карло были получены критические значения для  заданных уровней значимости. В случае, если фактическое значение критерия Дарбина — Уотсона превышает  критическое, то нулевую гипотезу об отсутствии коинтеграции отвергают

Недостатки:

-Неприменим  к моделям авторегрессии.

-Не способен  выявлять автокорреляцию второго  и более высоких порядков.

-Даёт достоверные  результаты только для больших  выборок 

20.назовите основные признаки мультиколлинеарности

Под мультиколлиарностью  понимается высокая взаимная коррелированность  объясняющих переменных.Она может  быть в явной и стохастической формах

Мультиколлинеарность  при проведении множественной регрессии  возникает в том случае, если какую-то из независимых переменных можно  предсказать на основании других независимых переменных (следовательно, имеет место дублирование информации). Наличие мультиколлинеарности приводит к тому, что оценки частных регрессионных  коэффициентов становятся нестабильными  – небольшие изменения в составе  наблюдений или переменных могут  вызывать радикальные изменения  регрессионных коэффициентов

Выделим некоторые  наиболее характерные признаки мультиколлинеарности.

  1. Небольшое изменение исходных данных (например, добавление новых наблюдений) приводит к существенному изменению оценок коэффициентов модели.
  2. Оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой (высокое значение коэффициента детерминации Rи соответствующей F-статистики).
  3. Оценки коэффициентов имеют неправильные с точки зрения теории знаки или неоправданно большие значения.
 

21.как проверить значимость уравнения регрессии и его коэффициентов

Проверить значимость уравнения регрессии- значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих  переменных для описания зависимой  переменной. Проверка значимости уравнения  регрессии производится на основе дисперсионного анализа. В математической статистике дисперсионный анализ рассмотрен как  самостоятельный инструмент статистического  анализа. Здесь же он применяется  как вспомогательное средство для  изучения качества регрессионной модели. Согласно основной идее дисперсионного анализа.Один из наиболее часто используемых вариантов проверки заключается в следующем. Для полученного уравнения регрессии определяется  -статистика – характеристика точности уравнения регрессии, представляющая собой отношение той части дисперсии зависимой переменной которая объяснена уравнением регрессии к необъясненной (остаточной) части дисперсии. Уравнение для определения  -статистики в случае многомерной регрессии имеет вид:

где:          – объясненная дисперсия – часть дисперсии зависимой переменной Y которая объяснена уравнением регрессии; 

        – остаточная дисперсия – часть дисперсии зависимой переменной Y которая не объяснена уравнением регрессии, ее наличие является следствием действия случайной составляющей;  

        – число точек в выборке; 

        – число переменных в уравнении регрессии.

Как видно из приведенной формулы, дисперсии  определяются как частное от деления  соответствующей суммы квадратов  на число степеней свободы. Число  степеней свободы это минимально необходимое число значений зависимой  переменной, которых достаточно для  получения искомой характеристики выборки и которые могут свободно варьироваться с учетом того, что  для этой выборки известны все  другие величины, используемые для  расчета искомой характеристики. Для получения остаточной дисперсии  необходимы коэффициенты уравнения  регрессии. В случае парной линейной регрессии коэффициентов два, по этому в соответствии с формулой (принимая  ) число степеней свободы равно  . Имеется в виду, что для определения остаточной дисперсии достаточно знать коэффициенты уравнения регрессии и только  значений зависимой переменной из выборки. Оставшиеся два значения могут быть вычислены на основании этих данных, а значит, не являются свободно варьируемыми.Для вычисления объясненной дисперсии значений зависимой переменной вообще не требуются, так как ее можно вычислить, зная коэффициенты регрессии при независимых переменных и дисперсию независимой переменной. Для того чтобы убедиться в этом, достаточно вспомнить приводившееся ранее выражение  . По этому число степеней свободы для остаточной дисперсии равно числу независимых переменных в уравнении регрессии (для парной линейной регрессии  ).

В результате  -критерий для уравнения парной линейной регрессии определяется по формуле:

.

В теории вероятности  доказано, что  -критерий уравнения регрессии, полученного для выборки из генеральной совокупности у которой отсутствует связь между зависимой и независимой переменной имеет распределение Фишера, достаточно хорошо изученное. Благодаря этому для любого значения  -критерия можно рассчитать вероятность его появления и наоборот, определить то значение  -критерия которое он не сможет превысить с заданной вероятностью.

Для осуществления  статистической проверки значимости уравнения  регрессии формулируется нулевая  гипотеза об отсутствии связи между  переменными (все коэффициенты при  переменных равны нулю) и выбирается уровень значимости  .

Уровень значимости – это допустимая вероятность  совершить ошибку первого рода –  отвергнуть в результате проверки верную нулевую гипотезу. В рассматриваемом  случае совершить ошибку первого  рода означает признать по выборке  наличие связи между переменными  в генеральной совокупности, когда  на самом деле ее там нет.

Обычно уровень  значимости принимается равным 5% или 1%. Чем выше уровень значимости (чем  меньше  ), тем выше уровень надежности теста, равный  , т.е. тем больше шанс избежать ошибки признания по выборке наличия связи у генеральной совокупности на самом деле несвязанных между собой переменных. Но с ростом уровня значимости возрастает опасность совершения ошибки второго рода – отвергнуть верную нулевую гипотезу, т.е. не заметить по выборке имеющуюся на самом деле связь переменных в генеральной совокупности. По этому, в зависимости от того, какая ошибка имеет большие негативные последствия, выбирают тот или иной уровень значимости.

Для выбранного уровня значимости по распределению  Фишера определяется табличное значение   вероятность превышения, которого в выборке мощностью  , полученной из генеральной совокупности без связи между переменными, не превышает уровня значимости.   сравнивается с фактическим значением критерия для регрессионного уравнения  .

Если выполняется  условие  , то ошибочное обнаружение связи со значением  -критерия равным или большим   по выборке из генеральной совокупности с несвязанными между собой переменными будет происходить с вероятностью меньшей чем уровень значимости. В соответствии с правилом “очень редких событий не бывает”, приходим к выводу, что установленная по выборке связь между переменными имеется и в генеральной совокупности, из которой она получена.

Если же оказывается  , то уравнение регрессии статистически не значимо. Иными словами существует реальная вероятность того, что по выборке установлена не существующая в реальности связь между переменными. К уравнению, не выдержавшему проверку на статистическую значимость, относятся так же, как и к лекарству с истекшим сроком годнос-ти – такие лекарства не обязательно испорчены, но раз нет уверенности в их качестве, то их предпочитают не использовать. Это правило не уберегает от всех ошибок, но позволяет избежать наиболее грубых, что тоже достаточно важно.Второй вариант проверки, более удобный в случае использования электронных таблиц, это сопоставление вероятности появления полученного значения  -критерия с уровнем значимости. Если эта вероятность оказывается ниже уровня значимости  , значит уравнение статистически значимо, в противном случае нет.После того как выполнена проверка статистической значимости регрессионного уравнения в целом полезно, особенно для многомерных зависимостей осуществить проверку на статистическую значимость полученных коэффициентов регрессии. Идеология проверки такая же как и при проверке уравнения в целом но в качестве критерия используется  -критерий Стьюдента, определяемый по формулам:

Информация о работе Шпаргалка по "Эконометрика"