Автор работы: Пользователь скрыл имя, 29 Марта 2011 в 12:33, контрольная работа
Задание:
1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.
2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.
3. Рассчитайте параметры а1 и а0 парной линейной функции и линейно-логарифмической функции
4. Оцените тесноту связи с помощью показателей корреляции (ryx и ηylnx) и детерминации (r2yx и η2ylnx), проанализируйте их значения.
5. Надёжность уравнений в целом оцените через F -критерий Фишера для уровня значимости a=0,05.
6. На основе оценочных характеристик выберите лучшее уравнение регрессии и поясните свой выбор.
7. По лучшему уравнению регрессии рассчитайте теоретические значения результата ( ), по ним постройте теоретическую линию регрессии и определите среднюю ошибку аппроксимации - ε'ср., оцените её величину.
8. Рассчитайте прогнозное значение результата , если прогнозное значение фактора ( ) составит 1,023 от среднего уровня ( ).
9. Рассчитайте интегральную и предельную ошибки прогноза (для a=0,05), определите доверительный интервал прогноза ( ; ), а также диапазон верхней и нижней границ доверительного интервала ( ), оцените точность выполненного прогноза.
7. Для оценки
статистической надёжности выявленной
зависимости дохода от доли занятых рассчитаем
фактическое значение F-критерия Фишера
– Fфактич. и сравним его
с табличным значением – Fтабл..
По результатам сравнения примем решения
по нулевой гипотезе , то есть, либо примем,
либо отклоним её с вероятностью допустить
ошибку, которая не превысит 5% (или с уровнем
значимости α=0,05).
В нашем случае,
Где k -число факторов
в уравнении; n - число изучаемых объектов.
Фактическое значение
критерия показывает,
что факторная вариация
результата в 137 раза
больше остаточной вариации,
сформировавшейся под
влиянием случайных
причин. Очевидно, что
подобные различия не
могут быть случайными,
а являются результатом
систематического взаимодействия
оборота розничной торговли
и общей суммы доходов
населения. Для обоснованного
вывода сравним полученный
результат с табличным
значением критерия:
при степенях свободы d.f.1=k=1
и d.f.2=n-k-1=11-1-1=9
и уровне значимости
α=0,05.
В силу того, что нулевую
гипотезу о статистической
не значимости выявленной
зависимости валового
регионального продукта
от среднегодовой численности
занятых в экономике
и её параметрах можно
отклонить с фактической
вероятностью допустить
ошибку значительно
меньшей, чем традиционные 5%.
Определим теоретические значения результата Yтеор. Для этого в полученное уравнение последовательно подставим фактические значения фактора X и выполним расчёт.
Например,
. См. гр. 5 расчётной таблицы. По парам
значений Yтеор. и
Xфакт. строится теоретическая
линия регрессии, которая пересечётся
с эмпирической регрессией в нескольких
точках. См. график 1.
9. Построим теоретическую линю регрессии, которая пересечётся с эмпирической регрессией в нескольких точках.
В
нашем случае, скорректированная
ошибка аппроксимации
составляет 15,776%. Она
указывает на невысокое
качество построенной
линейной модели и
ограничивает её использование
для выполнения точных
прогнозных расчётов
даже при условии
сравнительно небольшого
изменения фактора X (относительно
его среднего значения
).
Зависимость ВРП от численности занятых
Оценку качества
модели дадим с помощью
В нашем случае, скорректированная ошибка
аппроксимации составляет 15,776%. Она указывает
на невысокое качество построенной линейной
модели и ограничивает её использование
для выполнения точных прогнозных расчётов
даже при условии сравнительно небольшого
изменения фактора X (относительно его
среднего значения ).
Построение логарифмической функции предполагает
предварительное выполнение процедуры
линеаризации исходных переменных. В данном
случае, для преобразования нелинейной
функции в линейную введём новую переменную,
которая линейно связана с результатом.
Следовательно, для определения параметров
модели будут использованы традиционные
расчётные приёмы, основанные на значениях
определителей второго порядка.
Построение логарифмической
функции предполагает предварительное
выполнение процедуры линеаризации
исходных переменных. В данном случае,
для преобразования нелинейной функции
в линейную введём новую переменную
, которая линейно связана с результатом.
Следовательно, для определения параметров
модели
будут использованы традиционные
расчётные приёмы, основанные на значениях
определителей второго порядка. См. таблицу
№4.
№ | |||||||||
А | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
1 | 0,056 | -2,882 | 2,000 | 8,308 | -5,765 | -12,249 | 14,249 | 203,023 | 69,382 |
2 | 0,119 | -2,129 | 2,100 | 4,531 | -4,470 | 1,550 | 0,550 | 0,303 | 2,680 |
3 | 0,138 | -1,981 | 4,300 | 3,922 | -8,516 | 4,261 | 0,039 | 0,001 | 0,188 |
4 | 0,157 | -1, 852 | 5,100 | 3,428 | -9,443 | 6,623 | -1,523 | 2,318 | 7,414 |
5 | 0,220 | -1,514 | 7,600 | 2,293 | -11,507 | 12,799 | -5,199 | 27,025 | 25,314 |
6 | 0,287 | -1,248 | 10,500 | 1,558 | -13,107 | 17,665 | -7,165 | 51,341 | 234,890 |
7 | 0,422 | -0,863 | 18,900 | 0,744 | -16,306 | 24,722 | -5,822 | 33,901 | 28,352 |
8 | 0,758 | -0,277 | 13,000 | 0,077 | -3,602 | 35,444 | -22,444 | 503,720 | 109,288 |
9 | 1,008 | 0,008 | 43,400 | 0,000 | 0,346 | 40,662 | 2,738 | 7,499 | 13,335 |
10 | 1,147 | 0,137 | 50,000 | 0,019 | 6,857 | 43,026 | 6,974 | 48,632 | 33,958 |
11 | 1,812 | 0,594 | 69,000 | 0,353 | 41,016 | 51,397 | 17,603 | 309,860 | 85,715 |
Итого | 6,124 | -12,006 | 225,900 | 25,234 | -24,497 | 225,900 | 0,000 | 1187,624 | 410,517 |
Средняя | 0,557 | -1,091 | 20,536 | — | — | — | — | 2,9 | 10,5 |
Сигма | 0,535 | 1,050 | 21,852 | ||||||
Дисперсия, D | 0,286 | 1,103 | 477,502 |
Расчёт определителей второго порядка даёт следующие результаты:
Отсюда получаем параметры уравнения:
Полученное уравнение
имеет вид:
Оценочные показатели
позволяют сделать вывод, что
линейно-логарифмическая
Заключительным этапом решения данной
задачи является выполнение прогноза
и его оценка.
Если прогнозное значение фактора составит
1,023 от среднего уровня, то есть
Xпрогнозн.=
1,023*0,557=0,569, тогда прогнозное значение
результата сформируется на уровне: Yпрогнозн.
=39,565-1,491*0,569=38,715 (млрд. руб.).
Рассчитаем интегральную ошибку прогноза
-
, которая
формируется как сумма двух ошибок: из
ошибки прогноза как результата отклонения
прогноза от уравнения регрессии-
и ошибки прогноза
положения регрессии
. То есть,
Ошибка положения
регрессии составит: 0,012 (млрд. руб.).
Интегральная ошибка прогноза составит:
5,976 (млрд. руб.).
Предельная ошибка прогноза, которая не
будет превышена в 95% возможных реализаций
прогноза, составит:
= 2,26*5,976 = 13,506
≈ 14,0 (млрд. руб.). Табличное значение t-критерия
для уровня значимости α=0,05 и для степеней
свободы n-k-1 = 11-1-1=7 составит 2,26. Следовательно,
ошибка большинства реализаций прогноза
не превысит млрд. руб.
Это означает, что фактическая реализация
прогноза будет находиться в доверительном
интервале .
Верхняя граница
доверительного интервала составит
= 38,715 + 14,0 =
52,715(млрд. руб.).
Нижняя граница доверительного интервала
составит:
= 38,715 - 14,0
= 24,715(млрд. руб.).
Относительная величина различий значений
верхней и нижней границ составит:
=
раза. Это
означает, что верхняя граница в 2,13 раза
больше нижней границы, то есть точность
выполненного прогноза весьма невелика,
но его надёжность на уровне 95% оценивается
как высокая. Причиной небольшой точности
прогноза является повышенная ошибка
аппроксимации. Здесь её значение выходит
за границу 5-7% из-за недостаточно высокой
типичности линейной регрессии, которая
проявляется в присутствии единиц с высокой
индивидуальной ошибкой. Если удалить
территории с предельно высокой ошибкой
(например, Дагестан с
), тогда качество
линейной модели и точность прогноза по
ней заметно повысятся.
Задача№2.
Производится анализ значений социально-экономических показателей по территориям Северо-Западного федерального округа РФ за 2000 год..
Y – оборот розничной торговли, млрд. руб.;
X1 – кредиты, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам, млрд. руб.;
X2 – доля лиц в высшим и незаконченным высшим образованием среди занятых, %;
X3 – годовой доход всего населения, млрд. руб.
Требуется
изучить влияние указанных
Предварительный анализ исходных данных по 10 территориям выявил наличие двух территорий (г. Санкт-Петербург и Вологодская обл.) с аномальными значениями признаков. Эти территории должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных двух аномальных единиц.
При обработке исходных данных получены следующие значения:
А) - линейных
коэффициентов парной корреляции, средних
и средних квадратических отклонений
-σ:
N=8.
Y | X1 | X2 | X3 | |
Y | 1 | 0,2461 | 0,0117 | 0,9313 |
X1 | 0,2461 | 1 | 0,8779 | 0,0123 |
X2 | 0,8779 | 0,8897 | 1 | -0,2041 |
X3 | 0,9313 | 0,0123 | -0,2041 | 1 |
Средняя | 13,64 | 0,2134 | 22,29 | 24,69 |
4,250 | 0,1596 | 2,520 | 9,628 |
уровня
(
).
Б) - коэффициентов
частной корреляции
Y | X1 | X2 | X3 | |
Y | 1 | 0,3734 | -0,0388 | 0,9473 |
X1 | 0,3734 | 1 | 0,8483 | -0,2322 |
X2 | -0,0388 | 0,8483 | 1 | -0,1070 |
X3 | 0,9473 | -0,2322 | -0,1070 | 1 |
Задание:
1. По значениям линейных коэффициентов парной и частной корреляции выберите неколлинеарные факторы и рассчитайте для них коэффициенты частной корреляции. Произведите окончательный отбор информативных факторов во множественную регрессионную модель.
2. Выполните расчёт бета коэффициентов (b) и постройте с их помощью уравнение множественной регрессии в стандартизованном масштабе. Проанализируйте с помощью бета коэффициентов (b) силу связи каждого фактора с результатом и выявите сильно и слабо влияющие факторы.
3. По значениям b-коэффициентов рассчитайте параметры уравнения в естественной форме (a1, a2 и a0). Проанализируйте их значения. Сравнительную оценку силы связи факторов дайте с помощью общих (средних) коэффициентов эластичности - .
4. Оцените тесноту множественной связи с помощью R и R2, а статистическую значимость уравнения и тесноту выявленной связи - через F -критерий Фишера (для уровня значимости a=0,05).
5. Рассчитайте прогнозное значение результата, предполагая, что прогнозные значения факторов составят 108,5 процента от их среднего уровня.