Автор работы: Пользователь скрыл имя, 08 Июля 2012 в 16:08, шпаргалка
Работа содержит ответы на вопросы по дисциплине "Эконометрика".
1. Анализ линейной стат-кой связи экономических данных, корреляция, вычисление коэф-в корреляции. Проверка значимости коэф-в парной корреляции.
Большинство эконом. объектов находятся во всеохватывающей взаимосвязи. Наилучшим аппаратом явл-ся аппарат корреляционно-регрессионного анализа. Существует 2 вида зависимостей между эконом. переменными: 1) функциональная; 2) стохастическая (вероятностная). При функц-ой связи – каждому значению одной величины ставят в соответствие опр. значение другой. Такие встречаются редко. Как правило, по значению одной величины можно предсказать с опр. вероятностью значение другой (или найти мат. ожидание). Эта связь называется вероятностной, иногда применяют название «корреляционная зависимость». Между понятиями «корреляция» и «регрессия» существует связь и в то же время они различны. Корреляция позволяет установить тесноту и направление связи между переменными (коэф-ми корреляции). Регрессия определяет форму зависимости, функцию связи (модель регрессии). Корр. анализ предназначен для изучения характера связи между случ. переменными. Задачи корр. анализа: 1.оценка тесноты связи; 2. опр-е направления связи; 3. выбор ведущих факторов; 4. опр-е ранее неизвестных причинных связей. Виды корреляции: 1. по числу переменных: частная, парная и множественная; 2. по виду связей: линейная и нелинейная; 3. по направлению связи: прямая и обратная. Для решения задач корр. анализа применяются 3 коэф-та корреляции: 1. парный, 2. множественный, 3. частный.
Коэф-т парной линейной корреляции: . Свойства: 1) rx,y находится в инт-ле (-1;1); 2) rx,y>0 – связь прямая, rx,y<0 – связь обратная; 3) - связь тесная, - связь слабая. Для оценки стат. значимости коэф-та парной корреляции применяют t-критерий Стьюдента: n – количество данных в имеющихся совокупностях. Если tтабл<t, то коэф-т корреляции можно считать статистически значимым.
Коэффициент множественной корреляции. Корреляционная матрица не дает ответов на все вопросы, интересующие нас, для данной совокупности переменных. Возникают 2 дополнительные задачи: 1) как связана интересующая нас величина со всей совокупностью имеющихся факторов; 2) какой будет связь двух переменных при фиксировании или исключении влияния др. переменных. Для решения 1-ой задачи применяют коэф-т множественной корреляции: - определитель матрицы коэф-ов парной корреляции, Rjj – алгебраическое дополнение к элементу этой матрицы, стоящей на пересечении j-ой строки и j-ого столбца. Практическую зависимость имеет R2 – коэф-т детерминации, показывает, какая доля случайных колебаний одной величины обусловлена случайными колебаниями другой величины. Свойства: 1) R2 принадлежит интервалу (0;1); 2) - связь тесная.
Коэффициент частной корреляции. Этот коэф-т предназначен для оценки тесноты связи между 2-мя переменными при фиксировании или исключении влияния др. переменных. , Rxy – алгебраическое дополнение к элементу корреляционной матрицы, стоящему на пересечении строки х и столбца у. Аналогично Rxx, Ryy. Свойства rxy аналогичны свойствам rx,y.
2. Статистическая зависимость случайных переменных. Ковариация.
Для оценки параметров парной регрессии применяется МНК, который позволяет подобрать параметры уравнения так, чтобы соответственные точки графиков фактических и расчетных значений показателя находились на min расстоянии друг от друга. Требуется определить min функции: . Для минимизации этой функции определим частные производные этой функции по каждому параметру и =0. В результате, получиться система уравнений: Решение данной системы относительно переменных и дает формулы для расчета параметров: . Ковариация (cov): . Коэф-т ковариации применяется для оценки связи 2-ух переменных. В отличие от коэф-та корреляции, cov изм-ся в определенных единицах. В остальном cov аналогична корреляции, позволяет оценить силу и направление связи переменных.
3. Типы экономических данных, используемые в эконометрических исследованиях.
1) Временные ряды. Временными рядами называют ряды динамики, у которых в качестве признака упорядочения используется время. Они состоят из последовательных значений (уровней) показателя, характеризующего состояние процесса в определенные, как правило, равноотстоящие друг от друга моменты времени, причем каждый экономический показатель представлен в большинстве случаев лишь одним временным рядом.
2) Пространственные данные – данные по одной и той же величине в один и тот же период времени, но взятые в пространственно разделенных объектах: 1. курс «евро» сегодня в различных обменных пунктах; 2. %-ые ставки в различных банках; 3. объемы производства по различным предприятиям одной отрасли; 4. месячные товарообороты в различных магазинах.
4. Классификация эконометрических моделей.
Эконометрическая модель – образ экономического объекта, примерно воссоздаваемый с помощью математического языка.
Классификация:
1. модели временных рядов:
1.1. трендовые модели: кривые роста, адаптивные модели;
1.2. сезонные модели;
1.3. тренд сезонные модели;
2. регрессионные модели:
2.1. парные;
2.2. множественные;
2.3. линейные;
2.4. нелинейные;
3. системы одновременных уравнений (СОУ):
3.1.рекурсивные;
3.2.независимые;
3.3.взаимозависимые.
5. Основные этапы построения эконометрических моделей.
Парная линейная модель регрессии. Оценка параметров регрессионного уравнения. Для оценки параметров парной регрессии применяется МНК, который позволяет подобрать параметры уравнения так, чтобы соответственные точки графиков фактических и расчетных значений показателя находились на min расстоянии друг от друга. Требуется определить min функции: . Для минимизации этой функции определим частные производные этой функции по каждому параметру и =0. В результате, получиться система уравнений: Решение данной системы относительно переменных и дает формулы для расчета параметров: . Ковариация (cov): . Коэф-т ковариации применяется для оценки связи 2-ух переменных. В отличие от коэф-та корреляции, cov изм-ся в определенных единицах. В остальном cov аналогична корреляции, позволяет оценить силу и направление связи переменных.
Вариация ил дисперсия.
. Оценка параметра будет возможна (а, значит, и всей модели), если - идентифицируемость модели. Это условие выполняется, когда все xi совпадают со своим средним, тогда нет смысла в построении модели, т.к. все точки с координатами (xi,yi) будут находится на одной вертикальной прямой, заданной уравнением .
Модель множественной регрессии. Оценка параметров.
(1) yi=a0+a1xi1+a2xi2+…+amxim+ei
Запишем уравнение (1) в матричном виде (2) – y=aX+e;
. Для решения уравнения (2) применяют МНК, который дает матричную формулу: а=(ХТХ)-1ХТУ, ХТ – транспонированная матрица факторов, (ХТХ)-1 – обратная матрица.
6. Линейная модель парной регрессии. Оценка параметров с помощью МНК.
Если в построении модели участвует 1 независимый фактор и линейная независимая функция – парная линейная модель регрессии . xi – независимый фактор, уi – исследуемая величина, ei – ошибки модели (остатки) ei=yiф-yiр, , - параметры модели. задает начальное условие развития показателя у , - коэф-т регрессии, который показывает на сколько изменится величина у при изменении фактора на 1 единицу, характеризует интенсивность изменения у с каждой единицей изменения фактора. Если >0, то связь между переменными прямая и регрессия положительная, если <0, то связь обратная и регрессия отрицательная.
Основную информацию для анализа качества регрессионного уравнения можно получить из ряда остатков. Иногда только по одному графику остатков можно судить о качестве аппроксимации. Остатки модели должны обладать опр. свойствами: несмещенность, состоятельность, эффективность. На практике проверка этих свойств сводится к проверке 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек справа означает, что от выражения внутри них нужно взять целую часть. n – количество уровней в ряде.
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:. Для этого критерия задаются 2 таблич. границы d1 и d2.
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
5.Гомоскедастичность – постоянство дисперсии остатков по отношению к фактическим значениям фактора или показателя. Остатки называются гомоскедастичными, если они сосредоточены в виде горизонтальной полосы около оси xi, в противном случае остатки называют гетероскедастичными. Для исследования гомоскедастичности применяются различные тесты. Один из них называется тест Голдфельда-Квандта: 1) Упорядочение значений показателя у по степени возрастания фактора х. 2) Из упорядоченной совокупности убирают несколько «с» центральных значений: , р – число оцениваемых в модели параметров. В результате, получается 2 совокупности данных, в одной из них значения фактора будет наименьшими, а в другой – наибольшими. 3) Для каждой совокупности строят модель регрессии, по которой находят остатки: . Пусть S1 – большая сумма квадратов ошибок, а S2 – меньшая. 4) Определим отношение . 5) Полученное значение R сравнивают с табличным значением F-критерия Фишера. Если Fтабл<R, то предпосылка о гомоскедастичности нарушена. Чем больше R по отношению к Fтабл, тем более нарушена данная предпосылка. .
7. Оценка существенности параметров линейной регрессии.
Проверка значимости параметров проводится на основе t-критерия Стьюдента. Вначале рассчитывают стандартную ошибку модели Se. . Затем определяют стандартные ошибки каждого параметра уравнения: . Если tтабл<, то соотв. параметр уравнения считают статистически значимым tтабл=t(;n-k-1). Замечание: используя t-критерий можно опр-ть интервальные оценки для параметров регрессионного уравнения: .
8. Оценка параметров множественной регрессии МНК. Свойства оценок МНК.
Оценка качества модели множественной регрессии. Этот этап схож с процедурой проверки качества парной модели. Основную информацию получают из ряда остатков. Также проверяют 5 предпосылок МНК, но в случае 5 предпосылки (проверка гомоскедастичности) будут некоторые отличия. График остатков в случае множественной модели регрессии будет иметь несколько иной вид. По оси абсцисс можно отложить фактические данные показателя у. Для тестирования на гомоскедастичность можно применить тест Голдфельда-Квандта. Отличие будет только на 1 шаге: фактические данные факторов следует упорядочить по возрастанию показателя у. Для каждой совокупности строят модель множественной регрессии. Коэф-т детерминации в случае множ. регрессии также будет универсальной характеристикой качества, т.к. позволяет оценить точность модели, качество в целом, удачность выбора фактора. Однако, когда число факторов больше 1, коэф-т детерминации меняется. Поэтому определяют нормированный, который определяется по формуле . Свойство этого коэф-та аналогично свойствам R2. Показывает, какая доля случайных колебаний показателя у учтена в модели и обусловлена случайными колебаниями фактора. находится в интервале (0;1) и модель тем лучше, чем стремится к 1 (100 %).
Проверка 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек справа означает, что от выражения внутри них нужно взять целую часть. n – количество уровней в ряде.
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:. Для этого критерия задаются 2 таблич. границы d1 и d2.
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
9. Многомерный стат. анализ. Задачи классификации объектов: кластерный анализ, дискриминантный анализ.
МСА – одно из направлений развития одномерной статистики. В наст. вр. в условиях рыночной экономики методы многомерного анализа актуальны, т.к. соответствуют многовариантному подходу. В МСА выделяют 3 группы методов: 1. факторный анализ, 2. кластерный анализ, 3. дискриминантный анализ. Кластерный анализ предполагает классификацию объектов по нескольким признакам одновременно. Имеет широкое распространение при изучении массовых явлений. При этом строятся научно обоснованные классификации. Заранее неизвестно, сколько будет кластеров и какого объема. После кластеризации для каждого класса опр-ют кластерные профили, они позволяют установить, какая характеристика явл-ся преобладающей в группе объектов 1-го класса. Дискриминантный анализ – та же кластеризация, но объекты распределяются по уже существующим классам.
10. Регрессионные модели с переменной структурой (фиктивные переменные).
При построении регрессионного уравнения используются факторы, являющиеся количественными характеристиками. Иногда требуется ввести в модель регрессии некий качественный фактор. Это могут быть разного рода атрибутивные признаки (пол, образование, принадлежность к какому-либо региону и т.д.). чтобы ввести такие переменные в уравнение, их нужно преобразовать в количественные. Пусть у – цена квартиры, х - общая площадь квартиры, тогда общий вид регрессионного уравнения примет вид, у=а0+а1х. Сконструируем фиктивную переменную, означающую принадлежность квартиры к центральным или периферическим частям города. . Тогда получается уравнение 2-ухфакторной регрессии: y=a0+a1x+a2z. В этом уравнении параметр а2 показывает, на сколько дороже квартира в центре по сравнению с периферией города.
11. Измерение тесноты связи между показателями. Мультиколлинеарность и способы ее устранения.
Пусть в исследовании используется совокупность переменных у1, х1, х2,…, хm. Для каждой пары можно рассчитать коэф-ты парной линейной корреляции. В результате, получиться матрица коэф-в парной корреляции:
. Эта матрица симметрична относительно главной диагонали, т.е. состоит из двух одинаковых треугольников. Она позволяет выбрать факторы наиболее тесно связанные с интересующей нас величиной, а также установить связь между самими факторами. Как правило, в регрессионной модели нельзя включать факторы, тесно связанные между собой.
Одним из условий регрессионной модели явл-ся предположение о линейной независимости объясняющих переменных, т.е. решение задачи возможно лишь тогда, когда столбцы и строки матрицы исходных данных линейно независимы. Для экон. показателей это условие выполняется не всегда. Линейная или близкая к ней связь между факторами называется мультиколлинеарностью и приводит к линейной зависимости нормальных уравнений, что делает вычисление параметров либо невозможными, либо затрудняет содержательную интерпретацию параметров модели. Считают явление мультик-ти в исходных данных установленным, если коэф-т парной корреляции между 2-мя переменными больше 0,8. Чтобы избавиться от мультик-ти, в модель включают лишь один из линейно связанных между собой факторов, причем тот, который в большей степени связан с зависимой переменной. В качестве критерия мультик-ти может быть принято соблюдение следующих неравенств: ryxi>rxixk, ryxk>rxixk, rxixk<0,8. если приведенные неравенства (или хотя бы одно из них) не выполняется, то в модель включают тот фактор, который наиболее тесно связан с у.
12. Модель множественной регрессии. Технология разработки прогнозов на ПЭВМ с использованием спец. программ стат. обработки данных.
Модель парной регрессии устанавливает зависимость интересующей нас величины только от 1-го фактора. В экономике эта ситуация абстрактная. На показатель влияет целая совокупность факторов. Если использовать линейную математическую функцию, то в этом случае модель множественной регрессии примет вид yi=a0+a1xi1+a2xi2+a3xi3+…+amxi
Основные этапы анализа и прогнозирования: 1. выбор системы ведущих факторов для исследования; 2. построение модели, т.е. оценка ее параметров; 3. проверка стат. значимости уравнения регрессии и его параметров; 4. оценка качественных характеристик модели, т.е. проверка предпосылок МНК; 5. определения влияния отдельных факторов на исследуемую величину; 6. экономический прогноз.
Для определения прогнозных оценок факторов можно воспользоваться кривыми роста (экстаполяционными моделями). Построить лучшую кривую роста можно либо с помощью пакета «Олимп», либо с помощью MS Excel «Мастера диаграмм».
13. Многомерный стат. анализ. Задачи снижения размерности: факторный, компонентный анализ.
МСА – одно из направлений развития одномерной статистики. В наст. вр. в условиях рыночной экономики методы многомерного анализа актуальны, т.к. соответствуют многовариантному подходу. В МСА выделяют 3 группы методов: 1. факторный анализ, 2. кластерный анализ, 3. дискриминантный анализ. Факторный анализ предназначен для выявления в данной совокупности латентных (неявных) признаков, характеризующих систему. Экономическая система описывается большим числомпоказателей, что неудобно для анализа. За счет вращения этих показателей (опр. линейных комбинаций) исходная совокупность данных сокращается за счет замены ее главными факторами. Задачи: 1. отыскание скрытых, но объективно существующих закономерностей; 2. сжатие информации; 3. выделение главных факторов; 4. построение регрессионных моделей.
14. Измерение тесноты связи между показателями. Анализ матрицы коэффициентов парной корреляции.
Коэф-т парной линейной корреляции: . Свойства: 1) rx,y находится в инт-ле (-1;1); 2) rx,y>0 – связь прямая, rx,y<0 – связь обратная; 3) - связь тесная, - связь слабая.
Пусть в исследовании используется совокупность переменных у1, х1, х2,…, хm. Для каждой пары можно рассчитать коэф-ты парной линейной корреляции. В результате, получиться матрица коэф-в парной корреляции:
. Эта матрица симметрична относительно главной диагонали, т.е. состоит из двух одинаковых треугольников. Она позволяет выбрать факторы наиболее тесно связанные с интересующей нас величиной, а также установить связь между самими факторами. Как правило, в регрессионной модели нельзя включать факторы, тесно связанные между собой.
16. Оценка влияния факторов на зависимую переменную (коэф-ты эластичности, бета коэф-ты).
Коэф-ты корреляции также как и коэф-ты регрессии позволяют определить влияние факторов на показатели, но они не распределяют факторы по степени влияния. Для решения этой задачи используются 3 специальных коэф-та: 1. коэф-т эластичности; 2. коэф-т; 3. коэф-т.
1. . Этот коэф-т показывает, на сколько % изменится исследуемая величина при изменении соответствующего фактора на 1 %. Если эj<0, то связь между переменными обратная.
2. . коэф-т показывает, на какую часть своего СКО изменится исследуемая величина при изменении фактора на 1 СКО. Если j<0 , то между переменными связь обратная. Имеет широкое распространение в теории рисковых ситуаций.
3. rj – коэф-т парной корреляции. коэф-т показывает среднюю долю влияния j фактора в совокупном влиянии всех факторов.
17. Обобщенный МНК.
При нарушении гомоскедастичности рекомендуется традиционный МНК заменять обобщенным МНК. Обобщенный МНК применяется к преобразованным данным и позволяет получать оценки, которые обладают не только свойством несмещенности, но и имеют меньшие выборочные дисперсии.
Предположим, что среднее значение остаточных величин равно нулю. А вот дисперсия их не остается неизменной для разных значений фактора, а пропорциональна величине Кi, т.е. , где - дисперсия ошибки при конкретном i-ом значении фактора, - постоянная дисперсия ошибки при соблюдении предпосылки о гомоскедастичности остатков; Кi – коэф-т пропорциональности, меняющийся с изменением величины фактора, что и обусловливает неоднородность дисперсии.
При этом предполагается, что неизвестна, а в отношении величины К выдвигаются определенные гипотезы, характеризующие структуру гетероскедастичности.
В общем виде для уравнения при , модель примет вид: .
В ней остаточные величины гетероскедастичны. Предполагая в них отсутствие автокорреляции, можно перейти к уравнению с гомоскедастичными остатками, поделив все переменные, зафиксированные в ходе i-ого наблюдения на . Тогда дисперсия остатков будет величиной постоянной, т.е. .
Иными словами, от регрессии у по х мы перейдем к регрессии на новых переменных: и .
Уравнение регрессии примет вид: .
По отношению к обычной регрессии уравнение с новыми, преобразованными переменными представляет собой взвешенную регрессию, в которой переменные у и х взяты с весами .
Оценка параметров нового уравнения с преобразованными переменными приводит к взвешенному МНК, для которого необходимо минимизировать сумму квадратов отклонений вида: .
Соответственно получим следующую систему нормальных уравнений:
Если преобразованные переменные х и у взять в отклонениях от средних уровней, то коэф-т регрессии b можно определить как .
При обычном применении МНК к уравнению линейной регрессии для переменных в отклонениях от средних уровней коэф-т регрессии b определяется по формуле: .
Как видим, при использовании обобщенного МНК с целью корректировки гетероскедастичности коэф-т регрессии b представляет собой взвешенную величину по отношению к обычному МНК с весами 1/К.
18. Анализ и прогнозирование экономических объектов с помощью модели множественной регрессии.
Основные этапы анализа и прогнозирования:
1,выбор системы ведущих факторов для исследования;
2,построение модели, т.е. оценка ее параметров;
3,проверка стат. значимости уравнения регрессии и его параметров;
4,оценка качественных характеристик модели, т.е. проверка предпосылок МНК;
5,определения влияния отдельных факторов на исследуемую величину;
6,экономический прогноз.
7,Выбор системы ведущих факторов для исследования.
При построении системы факторов необходимо соблюдать следующие условия: 1) должны быть количественно измеримы; 2) теоретически обоснованы; 3) линейно независимы друг от друга; 4) одна модель не должна включать в себя совокупный фактор и факторы его образующие; 5) тесно связаны между собой. Для реализации 5-го требования строят матрицу коэф-в парной корреляции. На основании этой матрицы выбирают те факторы, связь которых с величиной наиболее тесная. Затем проверяют наличие мультиколлинеарности (МК) факторов. Два фактора МК, если . МК факторы нельзя включать в одну модель, нужно выбрать один из них или заменить оба совокупной функцией.
2. Оценка параметров.
(2) yi=a0+a1xi1+a2xi2+…+amxim+ei
Запишем уравнение (1) в матричном виде (2) – y=aX+e;
. Для решения уравнения (2) применяют МНК, который дает матричную формулу: а=(ХТХ)-1ХТУ, ХТ – транспонированная матрица факторов, (ХТХ)-1 – обратная матрица.
3. Оценка качественных характеристик модели.
Оценка значимости уравнения множественной регрессии проводится в полном соответствии с процедурой, применимой к парной модели, т.е. на основе F-критерия Фишера. Для оценки значимости параметров применяют t-критерий Стьюдента: , bjj – диагональный элемент матрицы (ХТХ)-1.
Если , то параметр аj считается статистически значимым. Если какой-либо параметр окажется не значим, то его нужно либо исключить, либо заменить другим.
4. Оценка качества модели.
Этот этап схож с процедурой проверки качества парной модели. Основную информацию получают из ряда остатков. Также проверяют 5 предпосылок МНК, но в случае 5 предпосылки (проверка гомоскедастичности) будут некоторые отличия. График остатков в случае множественной модели регрессии будет иметь несколько иной вид. По оси абсцисс можно отложить фактические данные показателя у. Для тестирования на гомоскедастичность можно применить тест Голдфельда-Квандта. Отличие будет только на 1 шаге: фактические данные факторов следует упорядочить по возрастанию показателя у. Для каждой совокупности строят модель множественной регрессии. Коэф-т детерминации в случае множ. регрессии также будет универсальной характеристикой качества, т.к. позволяет оценить точность модели, качество в целом, удачность выбора фактора. Однако, когда число факторов больше 1, коэф-т детерминации меняется. Поэтому определяют нормированный, который определяется по формуле . Свойство этого коэф-та аналогично свойствам R2. Показывает, какая доля случайных колебаний показателя у учтена в модели и обусловлена случайными колебаниями фактора. находится в интервале (0;1) и модель тем лучше, чем стремится к 1 (100 %).
Проверка 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек справа означает, что от выражения внутри них нужно взять целую часть. n – количество уровней в ряде.
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:. Для этого критерия задаются 2 таблич. границы d1 и d2.
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
5. Оценка влияния отдельных факторов на исследуемую величину.
Коэф-ты корреляции также как и коэф-ты регрессии позволяют определить влияние факторов на показатели, но они не распределяют факторы по степени влияния. Для решения этой задачи используются 3 специальных коэф-та: 1. коэф-т эластичности; 2. коэф-т; 3. коэф-т.
1. . Этот коэф-т показывает, на сколько % изменится исследуемая величина при изменении соответствующего фактора на 1 %. Если эj<0, то связь между переменными обратная.
2. . коэф-т показывает, на какую часть своего СКО изменится исследуемая величина при изменении фактора на 1 СКО. Если j<0 , то между переменными связь обратная. Имеет широкое распространение в теории рисковых ситуаций.
3. rj – коэф-т парной корреляции. коэф-т показывает среднюю долю влияния j фактора в совокупном влиянии всех факторов.
6. Прогнозирование.
1.Прогноз факторов либо моделями экстраполяции, либо по заданному правилу (xjпр.);
2.Точечный прогноз показателя: 3.Построение доверительного интервала прогноза:
Нижняя граница: упр-U; верхняя граница: упр+U.
19. Системы линейных одновременных уравнений (СОУ). Взаимозависимые и рекурсивные системы.
Регрессионное уравнение устанавливает зависимость одной величины от совокупности факторов. Как правило, нас может интересовать целый ряд величин у1, у2, у3…, которые зависят как от факторов, так и между собой. Для отображения такой паутины взаимосвязей используются системы уравнений. Они бывают 3 видов: 1. системы независимых уравнений; 2. рекурсивные системы; 3. системы взаимозависимых уравнений.
Рекурсивные системы:
Первое уравнение в таких системах является моделью множественной регрессии. В каждом последующем будут содержаться как все независимые факторы, так и зависимые переменные, оцененные ранее (предопределенные). Такие системы могут использоваться для анализа производительности труда и фондоотдачи.
Системы взаимозависимых уравнений: Эти системы используют для анализа динамики цены и зарплаты.
20. Оценка качества модели парной регрессии. Коэф-т детерминации.
Основную информацию для анализа качества регрессионного уравнения можно получить из ряда остатков. Иногда только по одному графику остатков можно судить о качестве аппроксимации. Остатки модели должны обладать опр. свойствами: несмещенность, состоятельность, эффективность. На практике проверка этих свойств сводится к проверке 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек справа означает, что от выражения внутри них нужно взять целую часть. n – количество уровней в ряде.
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:. Для этого критерия задаются 2 таблич. границы d1 и d2.
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
5.Гомоскедастичность – постоянство дисперсии остатков по отношению к фактическим значениям фактора или показателя. Остатки называются гомоскедастичными, если они сосредоточены в виде горизонтальной полосы около оси xi, в противном случае остатки называют гетероскедастичными. Для исследования гомоскедастичности применяются различные тесты. Один из них называется тест Голдфельда-Квандта: 1) Упорядочение значений показателя у по степени возрастания фактора х. 2) Из упорядоченной совокупности убирают несколько «с» центральных значений: , р – число оцениваемых в модели параметров. В результате, получается 2 совокупности данных, в одной из них значения фактора будет наименьшими, а в другой – наибольшими. 3) Для каждой совокупности строят модель регрессии, по которой находят остатки: . Пусть S1 – большая сумма квадратов ошибок, а S2 – меньшая. 4) Определим отношение . 5) Полученное значение R сравнивают с табличным значением F-критерия Фишера. Если Fтабл<R, то предпосылка о гомоскедастичности нарушена. Чем больше R по отношению к Fтабл, тем более нарушена данная предпосылка. .
Коэф-т детерминации: . Показывает, какая доля случайных колебаний показателя у учтено в модели и обусловлена случайными колебаниями фактора. и модель тем лучше, чем . Коэф-т детерминации явл-ся универсальным, т.к. позволяет оценить точность модели, качество в целом, удачность выбора фактора и подходит для случая линейной и нелинейной зависимости переменных.
21. Предпосылки МНК.
Основную информацию для анализа качества регрессионного уравнения можно получить из ряда остатков. Иногда только по одному графику остатков можно судить о качестве аппроксимации. Остатки модели должны обладать опр. свойствами: несмещенность, состоятельность, эффективность. На практике проверка этих свойств сводится к проверке 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек справа означает, что от выражения внутри них нужно взять целую часть. n – количество уровней в ряде.
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:. Для этого критерия задаются 2 таблич. границы d1 и d2.
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
5.Гомоскедастичность – постоянство дисперсии остатков по отношению к фактическим значениям фактора или показателя. Остатки называются гомоскедастичными, если они сосредоточены в виде горизонтальной полосы около оси xi, в противном случае остатки называют гетероскедастичными. Для исследования гомоскедастичности применяются различные тесты. Один из них называется тест Голдфельда-Квандта: 1) Упорядочение значений показателя у по степени возрастания фактора х. 2) Из упорядоченной совокупности убирают несколько «с» центральных значений: , р – число оцениваемых в модели параметров. В результате, получается 2 совокупности данных, в одной из них значения фактора будет наименьшими, а в другой – наибольшими. 3) Для каждой совокупности строят модель регрессии, по которой находят остатки: . Пусть S1 – большая сумма квадратов ошибок, а S2 – меньшая. 4) Определим отношение . 5) Полученное значение R сравнивают с табличным значением F-критерия Фишера. Если Fтабл<R, то предпосылка о гомоскедастичности нарушена. Чем больше R по отношению к Fтабл, тем более нарушена данная предпосылка. .
22. Отбор факторов при построении множественной регрессии. Мультиколлинеарность.
При построении системы факторов необходимо соблюдать следующие условия: 1) должны быть количественно измеримы; 2) теоретически обоснованы; 3) линейно независимы друг от друга; 4) одна модель не должна включать в себя совокупный фактор и факторы его образующие; 5) тесно связаны между собой. Для реализации 5-го требования строят матрицу коэф-в парной корреляции. На основании этой матрицы выбирают те факторы, связь которых с величиной наиболее тесная. Затем проверяют наличие мультиколлинеарности (МК) факторов. Два фактора МК, если . МК факторы нельзя включать в одну модель, нужно выбрать один из них или заменить оба совокупной функцией.
. Эта матрица симметрична относительно главной диагонали, т.е. состоит из двух одинаковых треугольников. Она позволяет выбрать факторы наиболее тесно связанные с интересующей нас величиной, а также установить связь между самими факторами. Как правило, в регрессионной модели нельзя включать факторы, тесно связанные между собой.
23. Модель множественной регрессии. Построение системы показателей-факторов.
Модель парной регрессии устанавливает зависимость интересующей нас величины только от 1-го фактора. В экономике эта ситуация абстрактная. На показатель влияет целая совокупность факторов. Если использовать линейную математическую функцию, то в этом случае модель множественной регрессии примет вид yi=a0+a1xi1+a2xi2+a3xi3+…+amxi
Построение системы показателей-факторов. При построении системы факторов необходимо соблюдать следующие условия: 1) должны быть количественно измеримы; 2) теоретически обоснованы; 3) линейно независимы друг от друга; 4) одна модель не должна включать в себя совокупный фактор и факторы его образующие; 5) тесно связаны между собой. Для реализации 5-го требования строят матрицу коэф-в парной корреляции. На основании этой матрицы выбирают те факторы, связь которых с величиной наиболее тесная. Затем проверяют наличие мультиколлинеарности (МК) факторов. Два фактора МК, если . МК факторы нельзя включать в одну модель, нужно выбрать один из них или заменить оба совокупной функцией.
24. Модель множественной регрессии. Выбор вида модели и оценка ее параметров.
Модель парной регрессии устанавливает зависимость интересующей нас величины только от 1-го фактора. В экономике эта ситуация абстрактная. На показатель влияет целая совокупность факторов. Если использовать линейную математическую функцию, то в этом случае модель множественной регрессии примет вид yi=a0+a1xi1+a2xi2+a3xi3+…+amxi
Оценка параметров: (1) yi=a0+a1xi1+a2xi2+…+amxim+ei
Запишем уравнение (1) в матричном виде (2) – y=aX+e;
. Для решения уравнения (2) применяют МНК, который дает матричную формулу: а=(ХТХ)-1ХТУ, ХТ – транспонированная матрица факторов, (ХТХ)-1 – обратная матрица.
25. Проверка качества многофакторных регрессионных моделей.
Оценка параметров:
(1) yi=a0+a1xi1+a2xi2+…+amxim+ei
Запишем уравнение (1) в матричном виде (2) – y=aX+e;
. Для решения уравнения (2) применяют МНК, который дает матричную формулу: а=(ХТХ)-1ХТУ, ХТ – транспонированная матрица факторов, (ХТХ)-1 – обратная матрица.
Оценка качества модели:
Этот этап схож с процедурой проверки качества парной модели. Основную информацию получают из ряда остатков. Также проверяют 5 предпосылок МНК, но в случае 5 предпосылки (проверка гомоскедастичности) будут некоторые отличия. График остатков в случае множественной модели регрессии будет иметь несколько иной вид. По оси абсцисс можно отложить фактические данные показателя у. Для тестирования на гомоскедастичность можно применить тест Голдфельда-Квандта. Отличие будет только на 1 шаге: фактические данные факторов следует упорядочить по возрастанию показателя у. Для каждой совокупности строят модель множественной регрессии. Коэф-т детерминации в случае множ. регрессии также будет универсальной характеристикой качества, т.к. позволяет оценить точность модели, качество в целом, удачность выбора фактора. Однако, когда число факторов больше 1, коэф-т детерминации меняется. Поэтому определяют нормированный, который определяется по формуле . Свойство этого коэф-та аналогично свойствам R2. Показывает, какая доля случайных колебаний показателя у учтена в модели и обусловлена случайными колебаниями фактора. находится в интервале (0;1) и модель тем лучше, чем стремится к 1 (100 %).
Проверка 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек справа означает, что от выражения внутри них нужно взять целую часть. n – количество уровней в ряде.
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:. Для этого критерия задаются 2 таблич. границы d1 и d2.
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
26. Множественная корреляция. Частная корреляция.
Коэффициент множественной корреляции. Корреляционная матрица не дает ответов на все вопросы, интересующие нас, для данной совокупности переменных. Возникают 2 дополнительные задачи: 1) как связана интересующая нас величина со всей совокупностью имеющихся факторов; 2) какой будет связь двух переменных при фиксировании или исключении влияния др. переменных. Для решения 1-ой задачи применяют коэф-т множественной корреляции: - определитель матрицы коэф-ов парной корреляции, Rjj – алгебраическое дополнение к элементу этой матрицы, стоящей на пересечении j-ой строки и j-ого столбца. Практическую зависимость имеет R2 – коэф-т детерминации, показывает, какая доля случайных колебаний одной величины обусловлена случайными колебаниями другой величины. Свойства: 1) R2 принадлежит интервалу (0;1); 2) - связь тесная.
Коэффициент частной корреляции. Этот коэф-т предназначен для оценки тесноты связи между 2-мя переменными при фиксировании или исключении влияния др. переменных. , Rxy – алгебраическое дополнение к элементу корреляционной матрицы, стоящему на пересечении строки х и столбца у. Аналогично Rxx, Ryy. Свойства rxy аналогичны свойствам rx,y.
27. Нелинейная регрессия. Нелинейные модели и их линеаризация.
y=f(x) – общий вид. Если в качестве f использовать нелинейную математическую зависимость, то получиться нелинейная модель парной регрессии. Различают 2 класса нелинейных моделей:
1. модели нелинейные относительно фактора, но линейные относительно параметров:
*полиномиальные: у=а0+а1х+а2х2+а3х3+…. Для перехода к линейной функции применяют простую замену переменных (х1=х2, х2=х3), у=а0+а1х+а2х1+а3х2…
*гиперболические: у=а0+а1/х, (х1=1/х); у=а0+а1х1.
2. степенную модель: у=ахв;
3. показательную: у=авх;
4. экспоненциальную: у=кеа+вх.
Модели являются нелинейными как относительно фактора, так и относительно параметра. Для их линеаризации использую процедуру логарифмирования. Таким образом, общая схема оценивания нелинейных моделей следующая:
1,линеаризация функции (простой заменой или логарифмированием);
2,оценка параметров линейной модели МНК;
3,обратный переход к исходному виду модели.
28. Интервалы прогноза по линейному уравнению парной регрессии.
Прогноз по регрессионной модели включает в себя следующие этапы:
прогноз фактора. Для получения прогнозных оценок фактора можно использовать правило опр. в условии или один из экстраполяционных методов. Методы экстраполяции (кривые роста) можно применять, если исходные данные в виде временных рядов.
2,точечный прогноз показателя: .
3,построение доверительного интервала:
Se – СКО, .
Нижняя граница: упр-U, верхняя граница: упр+U.
29. Функциональные и корреляционные связи между признаками. Измерение тесноты связи.
При построении системы факторов необходимо соблюдать следующие условия: 1) должны быть количественно измеримы; 2) теоретически обоснованы; 3) линейно независимы друг от друга; 4) одна модель не должна включать в себя совокупный фактор и факторы его образующие; 5) тесно связаны между собой. Для реализации 5-го требования строят матрицу коэф-в парной корреляции. На основании этой матрицы выбирают те факторы, связь которых с величиной наиболее тесная. Затем проверяют наличие мультиколлинеарности (МК) факторов. Два фактора МК, если . МК факторы нельзя включать в одну модель, нужно выбрать один из них или заменить оба совокупной функцией.
. Эта матрица симметрична относительно главной диагонали, т.е. состоит из двух одинаковых треугольников. Она позволяет выбрать факторы наиболее тесно связанные с интересующей нас величиной, а также установить связь между самими факторами. Как правило, в регрессионной модели нельзя включать факторы, тесно связанные между собой.
Коэф-т парной линейной корреляции: . Свойства: 1) rx,y находится в инт-ле (-1;1); 2) rx,y>0 – связь прямая, rx,y<0 – связь обратная; 3) - связь тесная, - связь слабая. Для оценки стат. значимости коэф-та парной корреляции применяют t-критерий Стьюдента: n – количество данных в имеющихся совокупностях. Если tтабл<t, то коэф-т корреляции можно считать статистически значимым.
30. Проверка значимости уравнения регрессии.
а) Проверка значимости уравнения. Для проверки применяют F-критерий Фишера: , k – число факторов уравнения. Если Fтабл<F, то уравнение считается статистически значимым. Fтабл=F(0,05; k; n-k-1).
Значимость регрессионного уравнения является проверкой качества уравнения. Показывает, что рассчитанные значения хорошо приближают фактические и что фактор в модели выбран правильно.
б) Проверка значимости параметров проводится на основе t-критерия Стьюдента. Вначале рассчитывают стандартную ошибку модели Se. . Затем определяют стандартные ошибки каждого параметра уравнения: . Если tтабл<, то соотв. параметр уравнения считают статистически значимым tтабл=t(;n-k-1). Замечание: используя t-критерий можно опр-ть интервальные оценки для параметров регрессионного уравнения: .
31. Проверка выполнения предпосылок МНК. Обнаружение гетероскедастичности.
Основную информацию для анализа качества регрессионного уравнения можно получить из ряда остатков. Иногда только по одному графику остатков можно судить о качестве аппроксимации. Остатки модели должны обладать опр. свойствами: несмещенность, состоятельность, эффективность. На практике проверка этих свойств сводится к проверке 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек справа означает, что от выражения внутри них нужно взять целую часть. n – количество уровней в ряде.
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:. Для этого критерия задаются 2 таблич. границы d1 и d2.
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
5.Гомоскедастичность – постоянство дисперсии остатков по отношению к фактическим значениям фактора или показателя. Остатки называются гомоскедастичными, если они сосредоточены в виде горизонтальной полосы около оси xi, в противном случае остатки называют гетероскедастичными. Для исследования гомоскедастичности применяются различные тесты. Один из них называется тест Голдфельда-Квандта: 1) Упорядочение значений показателя у по степени возрастания фактора х. 2) Из упорядоченной совокупности убирают несколько «с» центральных значений: , р – число оцениваемых в модели параметров. В результате, получается 2 совокупности данных, в одной из них значения фактора будет наименьшими, а в другой – наибольшими. 3) Для каждой совокупности строят модель регрессии, по которой находят остатки: . Пусть S1 – большая сумма квадратов ошибок, а S2 – меньшая. 4) Определим отношение . 5) Полученное значение R сравнивают с табличным значением F-критерия Фишера. Если Fтабл<R, то предпосылка о гомоскедастичности нарушена. Чем больше R по отношению к Fтабл, тем более нарушена данная предпосылка. .