Автор работы: Пользователь скрыл имя, 19 Марта 2012 в 07:42, контрольная работа
Задача 1. По территориям региона приводятся данные за 2011 г. (см. таблицу своего варианта).
Требуется:
Построить линейное уравнение парной регрессии Y от X .
Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
Оценить статистическую значимость параметров регрессии и корреляции с помощью F -критерия Фишера и t -критерия Стьюдента.
Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума X , составляющем 107% от среднего уровня.
Tкрит(n-m-1;α/2) = (17;0.025) = 2.11
Поскольку Tнабл > Tкрит , то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически - значим
Интервальная оценка для коэффициента корреляции (доверительный интервал).
Доверительный интервал для коэффициента корреляции
r(0.9699;0.999)
Коэффициент детерминации.
R2= 0.982 = 0.9692
т.е. в 96.92 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая
Скорректированный коэффициент детерминации:
Скорректированный коэффициент детерминизации немногим ниже.
Для ее проверки используют F-критерий Фишера.
При этом вычисляют фактическое (наблюдаемое) значение F-критерия, через коэффициент детерминации R2, рассчитанный по данным конкретного наблюдения.
По таблицам распределения Фишера-Снедоккора находят критическое значение F-критерия (Fкр). Для этого задаются уровнем значимости α (обычно его берут равным 0,05) и двумя числами степеней свободы k1=m и k2=n-m-1.
2) F-статистика. Критерий Фишера
Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y.
Более объективной оценкой является скорректированный коэффициент детерминации:
Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.
Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:
H0: β1 = β2 = ... = βm = 0.
Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера.
Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 20 - 2 -1 = 17, Fkp(2;17) = 3.59
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно.
Соответственно Fx2 указывает на целесообразность включения в модель фактора x2 после включения фактора x1.
Поскольку фактическое значение F > Fkp, то коэффициент Fx1 статистически значим, т.е. целесообразно включать в уравнение x1 после включения в него фактора x2.
Поскольку фактическое значение F < Fkp, то коэффициент Fx2 статистически не значим, т.е. не целесообразно включать в уравнение x2 после включения в него фактора x1.
6. Оставляем фактор x1.
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
20a + 202 b = 130.4
202 a + 2138 b = 1403.6
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 0.89, a = -2.42
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 0.89 x1 - 2.42
Задача 3. Имеются условные данные об объемах потребления электроэне
Требуется: