Автор работы: Пользователь скрыл имя, 15 Ноября 2011 в 11:00, контрольная работа
Предварительный анализ исходных данных выявил наличие одной территории (Краснодарский край) с аномальными значениями признаков. Эта территория исключена из дальнейшего анализа. Значения показателей в итоговых строках приведены без учёта указанной аномальной единицы.
В нашем случае,
Fфакт = rYX 2 /1- rYX 2 : k – 1/n – k = 0,899/0,101 : (2 – 1)/(12 – 2) = 8,9 : 0,1 = 89,0.
Фактическое значение критерия показывает, что факторная вариация результата почти в 89 раз больше остаточной вариации, сформировавшейся под влиянием случайных причин. Очевидно, что подобные различия не могут быть случайными, а являются результатом систематического взаимодействия среднегодовой стоимости основных фондов в экономике (по полной балансовой стоимости) и оборота розничной торговли. Для обоснованного вывода сравним полученный результат с табличным значением критерия: Fта6л = 4,96 при степенях свободы df1= k – 1 = 1 и df2 = n – k = 12 – 2 = 10 и уровне значимости α = 0,05.
Значения Fта6л представлены в таблице «Значения F-критерия Фишера для уровня значимости 0,05 (или 0,01)».
В силу того, что Fфакт = 89,0 > Fта6л = 4,96, нулевую гипотезу о статистической незначимости выявленной зависимости и её параметрах можно отклонить с фактической вероятностью допустить ошибку значительно меньшей, чем традиционные 5%.
Например,
Ŷ1 = – 3,3 + 0,17 * 4,2 = – 2,59. См. графу 5
расчётной таблицы. По парам значений
Yтеор и Хфакт
строится теоретическая линия регрессии,
которая пересечётся с эмпирической регрессией
в нескольких точках. См. график 1.
График 1
ε΄ = 1/n * ∑| Yфакт – Ŷ/Y| * 100% = 60,87% .
В нашем случае, скорректированная ошибка аппроксимации составляет 60,87%. Она указывает на невысокое качество построенной линейной модели. Которое не позволяет использовать ее для выполнения точных прогнозных расчётов даже при условии сравнительно небольшого изменения фактора X (относительно его среднего значения X).
Если
предположить, что прогнозное значение
фактора Х составит 1,07 от уровня
его средней, то есть Хпрогн.=
1,07 * 4,2 = 4,494, тогда прогнозное значение
результата сформируется на уровне: Yпрогн.=
0,336 + 0,512 * 4,494 = 2,637 млрд. руб.
Задача №3.
Для проверки
рабочих гипотез (№1 и №2) о связи
социально-экономических
Y1 – среднегодовая стоимость основных фондов в экономике, млрд. руб.;
Y2 – стоимость валового регионального продукта, млрд. руб.;
X1 – инвестиции прошлого, 1999, года в основной капитал, млрд. руб.;
X2 – кредиты прошлого, 1999, года, предоставленные предприятиям, организациям, банкам и физическим лицам, млрд. руб.
X3 – среднегодовая численность занятых в экономике, млн. чел.
Рабочие гипотезы:
Предварительный анализ исходных данных по 18 территориям выявил наличие трёх территорий (г. Москва, Московская обл., Воронежская обл.) с аномальными значениями признаков. Эти единицы должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных аномальных единиц.
При обработке
исходных данных получены следующие значения
линейных коэффициентов парной корреляции,
средних и средних квадратических отклонений
-σ:
N=15.
Для проверки рабочей гипотезы №1. Для проверки рабочей гипотезы №2.
Y1 | X1 | X2 | Y2 | X3 | |||
Y1 | 1 | 0,6631 | 0,7477 | Y2 | 1 | 0,7863 | 0,7337 |
X1 | 0,6631 | 1 | 0,4747 | 0,7863 | 1 | 0,6177 | |
X2 | 0,7477 | 0,4747 | 1 | X3 | 0,7337 | 0,6177 | 1 |
Средняя | 115,83 | 0,1615 | 3,75 | Средняя | 23,77 | 115,83 | 0,570 |
30,0303 | 0,1400 | 1,6836 | 7,2743 | 30,0303 | 0,1160 |
Задание:
1. Составьте систему уравнений в соответствии с выдвинутыми рабочими гипотезами.
2. Определите вид уравнений и системы.
3. На основе приведённых в условии значений матриц коэффициентов парной корреляции, средних и средних квадратических отклонений:
4. Выводы оформите краткой аналитической запиской.
Решение:
1.В соответствии с выдвинутыми рабочими гипотезами о связи признаков составим систему уравнений. Коэффициенты при эндогенных переменных обозначим через b , коэффициенты при экзогенных переменных - через a. Каждый коэффициент имеет двойную индексацию: первый индекс – номер уравнения, второй – индивидуальный номер признака. Тогда:
2. Особенность
данной системы в том, что в первом уравнении
факторы представлены перечнем традиционных
экзогенных переменных, значения которых
формируются вне данной системы уравнений.
Во втором уравнении в состав факторов
входит эндогенная переменная Y1, значения
которой формируются в условиях данной
системы, а именно, в предыдущем уравнении.
Системы уравнений, в которых переменные
первоначально формируются как результаты,
а в дальнейшем выступают в качестве факторов,
называются рекурсивными. Именно
с подобной системой уравнений имеем дело
в данной задаче.
3. Выполним расчёт b-коэффициентов и построим уравнения множественной регрессии в стандартизованном масштабе. Для уравнения №1:
По полученным
результатам построено
По данным
первого уравнения сделаем вывод,
что фактор (
) влияет на результат - среднегодовую(
) стоимость основных фондов в экономике
слабее, чем второй фактор(
) , т.к.
.
Второе уравнение можно построить на
основе следующих результатов:
Второе уравнение в стандартизованной форме имеет вид: .
Из второго
уравнения очевидно, что на Y2
– стоимость валового регионального продукта
среднегодовая стоимость основных фондов
в экономике оказывает более сильное влияние,
чем третий фактор.
4. Расчёт параметров уравнения регрессии
в естественной форме даёт следующие результаты:
=115,83 – 85,329*0,1615 – 9,969*3,75 = 64,665
По полученным
результатам построено
Параметры
уравнения №2 рассчитываются аналогичным
образом. Но главная отличительная особенность
их расчёта в том, что в качестве одного
из факторов выступают не фактические
значения
, а его теоретические значения
, полученные расчётным путём при подстановке
в уравнение №1 фактических значений факторов
и .
Указанным способом рассчитаны параметры
рекурсивного уравнения:
По полученным
результатам построено
Представим результаты построения уравнений в виде рекурсивной системы:
Значения
коэффициентов регрессии
5. Для каждого из уравнений системы рассчитаем показатели корреляции и детерминации.
В первом
уравнении факторы
и
объясняют 82,56%
вариации среднегодовой
стоимости основных
фондов в экономике,
а 17,44% его вариации определяется
влиянием прочих факторов.
Во втором уравнении
переменные
и
объясняют 84,72%
стоимости валового
регионального продукта,
а 15,28% изменений зависят
от прочих факторов. Обе регрессионные
модели выявляют тесную связь результата
с переменными факторного комплекса.
6.Оценим существенность выявленных зависимостей. Для этого сформулируем нулевые гипотезы о статистической незначимости построенных моделей и выявленных ими зависимостей:
и
Для проверки нулевых гипотез используется F-критерий Фишера. Выполняется расчёт его фактических значений, которые сравниваются с табличными значениями критерия. По результата сравнения принимается решение относительно нулевой гипотезы. В нашей задаче:
Табличные
значения F-критерия формируются под влиянием
случайных причин и зависят от трёх условий:
а) от числа степеней свободы факторной
дисперсии -
, где k – число факторных переменных
в модели; б) от числа степеней свободы
остаточной дисперсии -
, где n – число изучаемых объектов;
в) от уровня значимости , который определяет
вероятность допустить ошибку, принимая
решение по нулевой гипотезе. Как правило,
значение берут на уровне 5% (
=0,05), но при высоких требованиях к
точности принимаемых решений уровень
значимости составляет 1% (
=0,01) или 0,1% ((
=0,001).
В рассматриваемой задаче для и
для
и
=0,05 составляет 3,88. В силу того, что
нулевую гипотезу о статистической
незначимости характеристик уравнения
№1 следует отклонить, то есть
. Аналогичное решение принимается
и относительно второй нулевой гипотезы,
т.к.
. То есть, .Отклоняя нулевую гипотезу,
допустимо (с определённой степенью условности)
принять одну из альтернативных гипотез.
В частности, может быть рассмотрена и
принята гипотеза о том, что параметры
моделей неслучайны, то есть формируются
под воздействием представленных
в моделях факторов,
влияние которых на
результат носит систематический,
устойчивый характер.
Это означает, что полученные
результаты могут быть
использованы в аналитической работе
и в прогнозных расчётах, которые основаны
не только на влиянии
, но и на
влиянии эндогенной
переменной
Рекурсивные модели связей предоставляют
возможность подобного анализа и прогноза.