Автор работы: Пользователь скрыл имя, 31 Октября 2010 в 20:22, Не определен
Моделирование и идентификация парной линейной регрессии
Рисунок 1.12
1.4.2.5.
Рассчитаем суммы квадратов
1.4.2.6. Рассчитаем средние квадраты отклонений на одну степень свободы (1.20, 1.21, 1.22).
1.4.2.7.
Рассчитаем коэффициент
(1.24)
1.4.2.8. Вычислим F-отношение через средние квадратов отклонений на одну степень свободы (1.23),
1.4.2.9. Вычислим F-отношения, через коэффициент детерминации:
1.4.2.10. Вычислим табличное значение F-критерия,
Введем табличное значение F-критерия для уровня значимости а = 0,05, воспользовавшись стандартной функцией из статистической категории Fобр (FINV) с тремя аргументами: (уровень значимости; степень свободы числителя F-отношения; степень свободы знаменателя F-отношения). Для нашего случая в ячейку табличного значения F-критерия заносится формула «=FINV(0,05;1;98)»
1.4.2.11. Из данных вычислений получили:
Так как Ftable < F, то гипотеза Но о наличии связи между x и y принимается.
1.4.2.12.
При увеличении ошибки
Рисунок 1.12а
Рисунок 1.12б
1.4.2.13.
При ошибке регрессионной
1.5. Оценка доверительных интервалов линии регрессии и прогноза зависимой переменной.
1.5.1. Основные положения:
Стандартная ошибка в оценках параметров а и b определяется как:
(1.25)
(1.26)
Соответственно, доверительные интервалы для фактических коэффициентов bf и af будут:
(1.27)
Стандартное отклонение для линии регрессии определяется как:
(1.28)
Соответственно, доверительные интервалы для линии регрессии определяются как:
(1.29)
Стандартная ошибка прогноза определяется формулой по полученной линии регрессии определяется как:
(1.30)
Доверительные границы прогноза определяются как:
(1.31)
1.5.2. Последовательность выполнения процедуры оценки доверительных интервалов:
1.5.2.1. Скопируем лист и озаглавим его «Доверительные интервалы».
1.5.2.2. Сформируем заголовки таблицы модели:
Рисунок 1.13
1.5.2.3. Выделим ячейки (Рисунок 1.13) для расчета:
- стандартных ошибок оценки коэффициента b и a (CKOb, CKOa),
- значения t-критерия Стьюдента для коэффициентов b и a (tb, ta),
- табличного значения t-критерия (tinv),
-
верхних и нижних
1.5.2.4. Рассчитаем стандартные ошибки в оценке коэффициентов линии регрессии mb, ma (1.27, 1.28).
1.5.2.5.
Рассчитаем фактические
(1.32)
1.5.2.6.
Введем функцию расчета
Аргументы функции: доверительная вероятность (α) и число степеней свободы (n-2).
1.5.2.7.
Сопоставляя фактические и
т.к. ta>tтабл, tb< tтабл, то b-незначим, а не случайно отличается от нуля, а сформировалось под влиянием систематически действующей произвольной.
1.5.2.8. Рассчитаем верхние и нижние значения коэффициентов b и a для уровня значимости α=0,05 (1.29).
1.5.2.9. Добавим колонки с расчетом нижней и верхней границы линии регрессии (Рисунок 1.14).
Расчет производится по формулам (1.30, 1.31).
(При вводе формул обращаем особое внимание, на то, какие ссылки должны быть абсолютными, а какие - относительными).
Рисунок 1.14
1.5.2.10.
Построим точечные графики
Рисунок 1.15
1.5.2.11. Как видно на графике, при увеличении значений ошибки σе границы доверительных интервалов увеличиваются и наоборот, что говорит об ослаблении связи между x и y.
1.5.2.12.
Добавим колонки с расчетом
нижней и верхней границы
Вначале получим столбец значений СКО (1.32). После этого получить значения нижней и верхней границ (1.33). Данные интервалы учитывают статистический характер оценок коэффициентов b и a. Однако для больших объемов наблюдений значение в формуле (1.30).
относительно малы по сравнению с единицей. В этой связи оценка стандартной ошибка прогноза может быть определена как:
(1.33)
Рисунок 1.16
Доверительные интервалы в этом случае будут строиться аналогично. Однако следует учесть, что они справедливы лишь для конкретного набора зависимой и независимой переменных, т.е. для конкретных идентифицированных значений коэффициентов b и a.
1.5.2.13. Изменяя ошибку модели получим несколько доверительных границ прогноза.
Рисунок 1.17
1.5.2.14.
Из рисунка видно, что с
1.6. Идентификация с помощью функции «Линейн» («LINEST») ППП Excel. Для идентификации с помощью функции «Линейн» («LINEST») ППП Excel необходимо:
-выделим массив ячеек 2х5 (Рисунок 1.18).
-вызовем функцию «линейн».
-введем 4 аргумента:
-массив y
-массив x
-константа а – ИСТИНА
-статистические характеристики – ИСТИНА
Введем
данную формулу, как формулу массива
для этого нажмем на клавишу F2 или
активизируем строку формул. После
ввода формулы массива
Рисунок 1.18
Таблица 1.1 представляет возвращаемые переменные в ячейках формулы массива (Рисунок 1.18).
Таблица 1.1
Коэффициент регрессии, b | Свободный член, a |
СКО коэффициент регрессии b, mb | СКО коэффициента а, ma |
Коэффициент детерминации, D | Стандартное отклонение наблюдаемых значений независимой переменной от линии регрессии, σrem (корень из Drem) |
F-отношение | Число степеней свободы n-2 в F-критерии (1, n-2, α) |
Сумма квадратов отклонений, объясняемой регрессией | Остаточная сумма квадратов |
При повторе моделирования (путем нажатия клавиши F9) полученные с данной функцией результаты совпадают с ранее вычисленными «вручную».
1.7.
Идентификация с помощью «
Введем значение уровень надежности равный (1-α)100%, где α - уровень значимости. Например, для уровня значимости α =0,05, «Уровень значимости» будет составлять 95%.
Установим флажок на «выходном интервале» и в соседнюю ссылку вставим адрес левой верхней ячейки, с которой будут выводиться результаты анализа.
Рисунок 1.19
Рисунок 1.20 представляет результат анализа.
Заголовки таблицы «ВЫВОД ИТОГОВ».
Регрессионная статистика.
Множественный R – коэффициент корреляции, Данный пакет может быть использован для идентификации множественной регрессии (что будет рассмотрено далее), чем и объясняется определение данного коэффициента.
R-квадрат – коэффициент детерминации.
Стандартная ошибка – корень квадратный из среднего квадрата отклонений Drem.
Наблюдения – число наблюдений.
Дисперсионный анализ
Регрессия df – число степеней свободы (degree of freedom) для Sfact (сумма квадратов отклонений, обусловленная регрессией).
Остаток - df – число степеней свободы для Srem (остаточная сумма квадратов отклонений).
Итого - df – число степеней свободы для Scom (общая сумма квадратов отклонений).
Регрессия - SS –сумма квадратов отклонений, обусловленная регрессией (Sfact).