Автор работы: Пользователь скрыл имя, 09 Марта 2011 в 20:59, лекция
1.Условия применения метода и его ограничени
2.Мультиколлинеарность
3.Выбор типа многофакторной модели и факторных признаков
4.Системы показателей многофакторной корреляции и регрессии
Лекция
3. Множественная
регрессия
Парная
регрессия может дать хороший
результат при моделировании, если
влиянием других факторов, воздействующих
на объект исследования, можно пренебречь.
Поведение отдельных
Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. Спецификация модели включает два круга вопросов: отбор факторов и выбор вида уравнения регрессии.
Требования к факторам:
для зависимости
может
привести к нежелательным последствиям,
повлечь неустойчивость и ненадежность
оценок коэффициентов регрессии. Если
между факторами существует высокая
корреляция, то нельзя определить их изолированное
влияние на результативный показатель,
поэтому параметры уравнения регрессии
оказываются неинтерпретированными.
Специфическим для многофакторных систем является условие недопустимости слишком тесной связи между факторными признаками. Это условие часто именуется проблемой коллинеарности факторов. Коллинеарность означает достаточно тесную неслучайную линейную корреляцию одних факторов с другими. Часто рекомендуют исключить фактор, связанный с другим фактором при . Из двух тесно связанных друг с другом факторов рационально исключить фактор, слабее связанный с результативным признаком.
Более сложная методика требуется для нахождения и исключения фактора, не имеющего тесной связи с каким-либо отдельным фактором, но имеющего тесную многофакторную связь с комплексом остальных факторов. Это положение называют мультиколлинеарностью. Для ее измерения следует вычислить последовательно коэффициенты множественной корреляции (или детерминации) каждого фактора (в роли результата) со всеми прочими факторами (в роли объясняющих переменных). Обнаружив мультиколлинеарный фактор либо несколько таковых, следует рассмотреть возможность исключения наиболее зависимого от комплекса остальных фактора, если это не приведет к потере экономического смысла модели.
Коллинеарность и мультиколлинеарность факторов в экономических системах возникают неслучайно. В совокупности однородных предприятий или регионов, как правило, в силу законов экономики возникает параллельная вариация факторных признаков: те предприятия, которые имеют лучшие значения одних факторов, например, лучшие природные условия, одновременно имеют и более высокую фондо- и энерговооруженность, более высокую квалификацию персонала, лучшую технологию и т.п. Отсюда и неизбежная большая или меньшая коллинеарность всех факторов производства либо социально-экономических условий жизни.
Наличие в системе коллинеарности ухудшает математические качества модели, может привести к неустойчивости результативных параметров, резко меняющихся при небольшом изменении значений факторов.
Специфичной
проблемой многофакторного
Следует по возможности найти другую переменную, значения которой известны и которая находится в достаточно тесной связи с отсутствующим фактором. Например, если нет данных по региону о средней заработной плате, то их можно заменить величиной валового регионального продукта на душу населения, имея в виду, что между этими экономическими признаками должна быть тесная (хотя и неизвестная точно) связь.
Важно
учитывать, с какой целью строится
модель. Если целью является только
прогнозирование
Связь результативного признака y с факторами x1, x2, …, xk выражается уравнением:
где a – свободный член уравнения;
k – число факторов;
j – номер фактора;
i – номер единицы совокупности;
bj – коэффициент условно-чистой регрессии при факторе xj, измеряющий изменение результата при изменении фактора на его единицу, и при постоянстве прочих факторов, входящих в модель;
εi – случайная вариация yi, не объясненная моделью.
Модель в форме (22) является аддитивной. Это означает, что в основе модели лежит гипотеза о том, что каждый фактор что-то добавляет или что-то отнимает от значения результативного признака. Такая гипотеза о типе связи причин и следствия вполне отражает ряд экономических систем взаимосвязанных признаков. Например, если y – это урожайность сельскохозяйственной культуры, а x1, x2, …, xk – агротехнические факторы: дозы разных видов удобрений, число прополок, поливов, доля потерь при уборке, то действительно, каждый из этих факторов либо повышает, либо снижает величину урожайности, причем результат может существовать и без любых из перечисленных факторов.
Однако аддитивная модель пригодна не для любых связей в экономике. Если изучается такая связь как зависимость объема продукции предприятия y от занимаемой площади x1, числа работников x2, стоимости основных фондов x3 (или всего капитала), то каждый из факторов является необходимым для существования результата, а не добавлением к нему. В таких ситуациях нужно исходить из гипотезы о мультипликативной форме модели:
(23)
Такая модель по ее первым создателям получила название «модель Кобба-Дугласа».
Возможна и смешанная форма модели, в которой одни факторы будут входить аддитивно, а другие мультипликативно.
При выборе факторных признаков следует исходить из следующих положений.
Рассмотрим данную систему показателей на примере связи урожайности зерновых культур в 51 агрофирме Орловской области. Первоначально были отобраны 8 факторных признаков, которые могут влиять на вариацию урожайности:
x1 – размер посевной площади зерновых, га;
x2 – удельный вес зерновых в общей площади, %;
x3 – затраты на 1 га посева зерновых, тыс. руб./га;
x4 – затраты труда на 1 га, чел.-ч;.
x5 – уровень оплаты труда, руб./чел.-ч.;
x6 – энергообеспеченность, л.с./100 га пашни;
x7 – число комбайнов на 1000 га зерновых, шт.;
x8 – число трактористов-машинистов на 100 га пашни, чел.
Первоначальное уравнение регрессии имеет вид:
Однако надежно отличными от нуля оказались только коэффициенты при x3 (t-критерий равен 10,5) и при x8 (t-критерий равен 2,72). Большую надежность, чем другие факторы имеет и x5.
После отсева ненадежных факторов, т.е. исключения их из уравнения, окончательное уравнение регрессии таково:
Таким образом, на различие урожайности в данных 51 агрофирмы сильнее всего и надежно повлияли различия между предприятиями в затратах на 1 га, в уровне оплаты труда и в обеспеченности квалифицированными работниками.
Каждый из коэффициентов, называемых коэффициентами чистой регрессии, интерпретируются как величина изменения урожайности при условии, что данный фактор изменяется на принятую единицу измерения, а два других фактора остаются постоянными на средних уровнях. Например, b3 означает, что при увеличении затрат на 1 га зерновых и при неизменности оплаты труда и обеспеченности трактористами-машинистами урожайность в среднем увеличивалась в среднем на 4, 6 ц/га. Термин «условно чистая регрессия» означает, что влияние отдельного фактора очищено от сопутствующей вариации только тех факторов, которые входят в уравнение, но не очищено от возможной сопутствующей вариации других факторов.