Множественная регрессия

Автор работы: Пользователь скрыл имя, 09 Марта 2011 в 20:59, лекция

Описание работы

1.Условия применения метода и его ограничени
2.Мультиколлинеарность
3.Выбор типа многофакторной модели и факторных признаков
4.Системы показателей многофакторной корреляции и регрессии

Файлы: 1 файл

3.множественная регрессия.doc

— 178.00 Кб (Скачать файл)

     Величина  коэффициентов условно чистой регрессии  зависит от принятых единиц измерения. Если бы фактор x3 измерялся не в тысячах рублей на гектар, а в рублях на гектар, то коэффициент b3 был бы равен 0,00461 руб./га. Следовательно, сравнивать между собой коэффициенты условно чистой регрессии нельзя. Чтобы получить сравнимые коэффициенты влияния вариации факторов на вариацию результата, следует избавиться от единиц измерения, привести к одной условной единице. Для этого можно применить два способа.

     Первый  способ называется стандартизацией. Этот термин возник из английского названия среднего квадратического отклонения (Standard deviation). Стандартизированные коэффициенты регрессии выражаются в долях или величинах, если они превышают единицу – в величинах σy. Стандартизированные коэффициенты обозначают греческой буквой β и называют бета-коэффициентами. Их формула такая:

     

  (24)

     В нашем примере получаем:

       β3 = 0,772;

     β5 = 0,147;

     β8 = 0,223.

     Интерпретация бета-коэффициентов такова: при изменении  фактора x3 на одно его среднее квадратическое отклонение от средней величины и при постоянстве других факторов результативный признак (урожайность) отклонится от своего среднего уровня на 0,772 его среднего квадратического отклонения. Так как все стандартизированные коэффициенты выражены в одинаковых единицах измерения, в σy, они сравнимы между собой, и можно сделать вывод, что на вариацию урожайности сильнее всего повлияла в изучаемой совокупности предприятий вариация затрат на гектар посева.

     Другой  способ приведения коэффициентов регрессии  к сравнимому виду – их преобразование в коэффициенты эластичности. Формула  коэффициента эластичности ℓj:

        (25)

     Интерпретируется  коэффициент эластичности следующим  образом: при изменении фактора  xj на его среднюю величину и при постоянстве других входящих в уравнение факторов результативный признак в среднем изменится на ℓj части его средней величины (или на ℓj средних, если ℓj>1, что бывает реже). Часто говорят, «изменится на ℓj процентов на 1% изменения фактора».

     В нашем примере имеем:

     

     Коэффициенты  эластичности так же выражены, как  и βj, в одинаковых единицах и сравнимы между собой. Ими удобнее, чем β-коэффициентами, пользоваться в планировании и прогнозировании. Вряд ли менеджер станет планировать увеличение фактора, скажем, инвестиций на 0,6 сигмы. Обычно планируют изменение факторов, если они управляемы, на столько-то процентов от достигнутого уровня. Например, если планируем увеличить затраты на гектар зерновых на 10%, оплату труда на 30%, а обеспеченность квалифицированными трактористами-машинистами на 20%, то можно ожидать изменения урожайности на , где kj – планируемые темпы прироста факторов.

     Имеем:

     Теперь  рассмотрим систему показателей  тесноты многофакторных связей. Прежде всего строится матрица парных коэффициентов  корреляции (табл. 1). 

     Таблица 1. Матрица парных коэффициентов корреляции

Признаки y x3 x5 x8
y 1      
x3 0,860 1    
x5 0,350 0,223 1  
x8 0,443 0,248 0,141 1
 

     Матрица парных коэффициентов корреляции дает исходные данные для других показателей  тесноты связи и для первичной  проверки на коллинеарность. В данном случае все связи между факторами слабые, коллинеарность не испортит модель.

     Важнейшим показателем тесноты связи в  многофакторной системе является коэффициент  множественной детерминации R2. Он измеряет общую тесноту связи вариации результативного признака y с вариацией всей системы входящих в модель факторов. Величина коэффициента множественной детерминации может быть вычислена несколькими способами.

     1.Вычисление  на основе матрицы парных коэффициентов  корреляции

     

,

     где Δ* - определитель матрицы;

      ,  (26)

     а Δ – определитель матрицы, не включающей первой строки Δ* и ее последнего столбца, т.е.:

      .

     При двух факторах получается упрощенная формула расчета:

         (27)

     Из (27) следует, что при независимости факторов друг от друга, т.е. , коэффициент множественной детерминации есть сумма парных коэффициентов детерминации.

     Пользуясь формулой (27), можно вычислить три  возможных двухфакторных коэффициента детерминации:

     

     

     

     2.Вычисление  на основе парных коэффициентов  корреляции и β-коэффициентов:

     

  (28)

     В примере: R2=0,86·0,772+0,35·0,147+0,433·0,223=0,8119.

     3.Вычисление  как корреляционное отношение, т.е. отношение вариации результативного признака y, связанной с вариацией системы факторов, входящих в модель (в уравнение регрессии), ко всей, общей, вариации результативного признака:

     

.  (30)

     Числитель формулы (30) – это сумма квадратов отклонений индивидуальных расчетных значений результативного признака от его средней, а знаменатель – сумма квадратов фактических значений результативного признака от средней, для всех единиц совокупности.

     Частными  коэффициентами детерминации называются показатели, измеряющие, на какую долю уменьшается необъясненная вариация уже имеющимися в модели факторами при включении в модель данного фактора xm. Формула частного коэффициента детерминации такова:

         (31)

     В нашем примере:

     

     

     

     Интерпретация такова: включение в модель фактора  x3 после x5 и x8 уменьшает необъясненную вариацию y на 74%; включение фактора x5 после x3 и x8 уменьшает необъясненную вариацию y на 10%; включение фактора x8 после x3 и x5 уменьшает необъясненную вариацию y на 20%.

     Коэффициенты  частной детерминации несравнимы между  собой, так как это доли разных величин-знаменателей.

     Извлекая  корень квадратный из любого коэффициента детерминации, получают коэффициент соответствующей корреляции: множественной, парной или частной. 
 

    5. Включение в многофакторную  модель неколичественных  факторов 

     Неколичественными являются такие факторы аграрного  производства, как природная зона, форма собственности предприятий, преобладающее производственное направление (отрасль) и другие. Предпочтительно не смешивать в исходной совокупности предприятия или регионы, различающиеся по этим качественным признакам. Но может возникнуть и необходимость построения модели с неоднородными единицами совокупности, например, если число единиц, однородных по качественному признаку, слишком мало для надежной связи. Иногда может быть поставлена цель измерения чистого влияния неколичественного фактора, например, формы собственности на результаты производства, а это требует включения качественного фактора в многофакторную модель.

     В таких случаях качественные градации признака можно закодировать специальными переменными, часто называемыми  «фиктивными» или «структурными» переменными. Они отражают неоднородность качественной структуры совокупности. Предположим, необходимо построить регрессионную модель рентабельности продукции предприятий, причем в регионе имеется 16 государственных предприятий, 28 частных, 13 кооперативной формы собственности.

     Если  игнорировать различия, связанные с  формой собственности, то они или  уйдут в остаточную вариацию, ухудшив  модель рентабельности, либо в неизвестной  пропорции станут смешиваться с  влиянием тех или иных качественных факторов, искажая меру их влияния.

     Необходимо  для m неколичественных факторов или градаций такового фактора ввести m-1 структурную переменную, обозначим которую Uj. Данные для расчета будут иметь следующий вид при m=3 (табл. 2). 

     Таблица 2. Исходные данные со структурными переменными

Форма собственности Единица совокупности Количественные  признаки Структурные переменные
y X1 X2 Xk U1 U2
Государственная 1

2

.

.

16

Значения  этих признаков 0

0

.

.

0

0

0

.

.

0

Частная 17

18

.

.

43

44

Значения  этих признаков 1

1

.

.

1

1

0

0

.

.

0

0

Кооперативная 45

46

.

.

57

58

Значения  этих признаков 0

0

.

.

0

0

1

1

.

.

1

1

 

     В результате решения будет получена модель вида:

     

     где xk+1 соответствуют переменной U1, а xk+2 – переменной U2.

     Перепишем модель в специальных обозначениях:

        (32)

     Значение  коэффициентов при структурных  переменных таково: коэффициент c1 означает, что предприятия частной формы собственности при тех же значениях количественных факторов x1…xk имеют рентабельность на c1 больше, чем государственные предприятия, которые приняты за базу сравнения (не имеют структурных переменных U1 и U2). Предприятия кооперативной формы собственности имеют рентабельность на c2 большую, чем государственные. Величины c1 и c2 могут быть как положительными, так и отрицательными.

     Вместо  общей модели можно записать три  частные модели для предприятий  отдельных групп по формам собственности, присоединяя коэффициент при  структурной переменной к свободному члену уравнения:

     а) для предприятий государственного сектора

     

     б) для предприятий частного сектора

     

     в) для предприятий кооперативного сектора

       
 

6.Применение  многофакторных регрессионных  моделей для анализа  деятельности предприятий  и прогнозирования 

     Оценка  деятельности на основе регрессионной  модели в сравнении с простейшим приемом такой оценки – сравнением результата, достигнутого данным предприятием, со средним результатом по однородной совокупности – дает дополнительные преимущества.

     Согласно нашему примеру, средняя урожайность по 51 агрофирме составила 22,9 ц/га зерна.

     Агрофирма 1 получила 17,6 ц/га. Следовательно, эта  фирма отстающая. Однако возникает  вопрос: может быть и условия производства у этой фирме были хуже средних? Сравнение  со средней по совокупности полностью игнорирует различие в «факторообеспеченности» предприятий, а на самом деле предприятия всегда находятся не в одинаковых условиях.

Информация о работе Множественная регрессия