Автор работы: Пользователь скрыл имя, 31 Октября 2010 в 20:22, Не определен
Моделирование и идентификация парной линейной регрессии
Поскольку при копировании данные адреса, где заданы математическое ожидание и среднее квадратическое отклонение не должны изменяться, ссылки на них должны быть абсолютными.
1.2.2.7.
Рассчитаем теоретическое
, (1.5)
1.2.2.8. Смоделируем ошибку модели.
Ошибка
модели моделируется центрированным нормальным
законом распределения
[σe] - абсолютная ссылка на ячейку, где задано среднее квадратическое отклонение ошибки регрессионной модели.
1.2.2.9.
Рассчитаем фактическое
1.2.2.10. Моделируем сто наблюдений.
Пользуясь средствами копирования содержимого ячеек в Excel получаем 100 наблюдений независимой и зависимой переменной. В ячейку количества наблюдений n ввести 100.
1.2.2.11. Рассчитаем коэффициенты корреляции и детерминации.
В ячейку для коэффициента корреляции вводим функцию «коррел» из категории «статистические» для массивов зависимой и наблюдаемой независимой (с учетом ошибки) переменных.
Коэффициент детерминации равен:
, (1.6)
1.2.2.12. Рассчитаем средние, суммы и СКО:
Рисунок 1.4
В соответствующие ячейки независимой переменной вводим формулы расчета среднего значения, суммы и среднего квадратического отклонения.
Скопируем данные формулы для значений зависимой (факторной, наблюдаемой) переменных и ошибки регрессии (Рисунок 1.4).
Рисунок 1.5
Представим копию интерфейса с таблицей из первых 10-ти наблюдений и двух зависимостей (Рисунок 1.5).
1.2.2.13. Исследуем влияние параметров регрессионной модели на связь y(x) Исследуем влияние СКО ошибки регрессионной модели на коэффициент корреляции и детерминации. Изменяя СКО ошибки модели получаем моделируемые значения наблюдений (Рисунок 1.6, в верхней части приведены значения коэффициентов корреляции и детерминации).
Рисунок 1.6
Исследуем влияние коэффициента регрессии b на связь зависимой переменной от независимой. Построим графики для различных коэффициентов регрессии. Значения коэффициента регрессии b приведены в верхней части рисунка:
Рисунок 1.7
Исследуем влияние коэффициента а на связь зависимой переменной от независимой. Построим графики для различных коэффициентов а (а>0, а<0). Значения коэффициента регрессии a приведены в верхней части рисунка:
Рисунок 1.8
1.2.2.14. Сделаем выводы из полученных данных:
- знак коэффициента регрессии b имеет прямую связь со знаком коэффициента корреляции r. При изменении знака коэффициента регрессии b, меняется и знак коэффициента корреляции r.
-
при уменьшении среднего
- при изменении параметра a коэффициент эластичности не меняется.
-
примеры регрессионных
b>0 - зависимость средней заработной платы от среднедушевого прожиточного минимума в день одного трудоспособного человека.
b<0 - зависимость расходов на покупку продовольственных товаров (в общих расходах %) от среднедневной заработной платы одного работающего.
a>0 – зависимость расходов предприятия от объема производства.
a<0 -
1.3. Идентификация
модели парной линейной
1.3.1. Основные положения процедуры идентификации:
Идентификация параметров модели основана на минимизации суммы квадратов отклонений наблюдаемой переменной от теоретической зависимости
(1.7)
т.е. необходимо найти такие коэффициенты a и b, которые позволяют получить наименьшее значение суммы квадратов отклонений в данном выражении. Дифференцирование данного выражения по коэффициентам a и b, приравнивание производных нулю:
(1.8)
позволяет получить систему нормальных уравнений:
(1.9)
Поделив, левые и правые части на n получаем:
(1.10)
Данный метод вычисления коэффициентов называется методом наименьших квадратов (МНК). Выражая средние значения через оператор среднего:
(1.11)
Система нормальных уравнений имеет вид:
(1.12)
Решение данной системы уравнений относительно a и b на основе формулы Крамера имеет вид:
(1.13)
Коэффициент a может быть получен как:
(1.14)
Данный коэффициент может быть получен также по формуле, вытекающей из теоретического уравнения линейной регрессии:
, т.е. (1.15)
(1.16)
1.3.2. Последовательность выполнения:
1.3.2.1.
Создаем копию листа «Модель»
помещаем его перед листом
«Лист2» и переименуем его
1.3.2.2. Выделяем ячейки (Рисунок 1.9) для расчета:
- коэффициентов a и b,
- значений xy, x2.
- значений y, полученных по рассчитанным коэффициентам a и b.
Колонки y=bx+a и e в расчете коэффициентов a и b участия не принимают, поскольку теоретическая зависимость и погрешность нам не известна. Именно их мы оцениваем по моделируемому фактическому значению y=bx+a+e.
Рисунок 1.9
1.3.2.3. Рассчитаем значения xy, x2.
1.3.2.4.
Получим средние значения, входящие
в формулы расчета
1.3.2.5. Рассчитаем коэффициенты a и b по формулам (1.15) и (1.16).
1.3.2.6.
Сопоставим заданные
1.3.2.7.
Получим столбец
1.3.2.8. Добавим к графику факторной линии регрессии график идентифицируемой линии (с рассчитанными коэффициентами).
1.3.2.9. Увеличивая СКО случайного отклонения σе получаем два графика факторной и идентифицируемой линии регрессии (Рисунок 1.10).
Рисунок 1.10
Рисунок 1.11
1.3.2.10. При увеличении СКОе уменьшаются коэффициенты корреляции r и детерминации D, а, следовательно, уменьшается связь между изучаемыми параметрами. И это наглядно видно на графиках - несовпадение факторной и идентифицируемой линии регрессии.
1.3.2.11. Получим два наблюдения за процессом при одном и том же относительно большом СКОе и построим графики (Рисунок 1.11).
Изменение параметров линии регрессии происходит потому, что происходит изменение влияния случайных факторов на связь между изучаемыми параметрами.
1.4. Оценка существенности параметров линейной регрессии и корреляции.
1.4.1. Основные положения:
Общая сумма квадратов отклонения независимой переменой y может быть представлена суммой квадратов отклонения y и остаточной суммы квадратов переменной
(1.17)
Scom
Общая сумма квадратов отклонений |
Sfact
Сумма квадратов отклонений, обусловленная регрессией |
Srem
Остаточная сумма квадратов отклонений |
Средние квадраты данных отклонений вычисляется как:
(1.18)
(1.19)
(1.20)
F-отношение определяется как:
(1.21)
Нулевая гипотеза (об отсутствии связи между y и x) принимается если:
, где (1.22)
Ftable(1,n-2,α) - табличное значение F-критерия для степеней свободы 1 (числитель), n-2 (знаменатель),α - уровень значимости.
Гипотеза о наличии связи между y и x принимается если
(1.23)
1.4.2. Порядок выполнения проверки нулевой гипотезы:
1.4.2.1. Сделаем копию листа и озаглавим его «Существенность параметров».
1.4.2.2. Сформируем заголовки таблицы модели (Рисунок 1.12).
1.4.2.3. Выделим ячейки для расчета:
- средних квадратов отклонений на одну степень свободы (Dcom, Dfact, Drem),
- коэффициента детерминации D через суммы квадратов отклонений,
- средних квадратов отклонений,
- F-отношения, через средние квадратов отклонений на одну степень свободы,
- F-отношения, через коэффициент детерминации,
-
табличного значения F-
1.4.2.4. Сформируем заголовки строк для расчета сумм квадратов отклонений.