Автор работы: Пользователь скрыл имя, 29 Марта 2011 в 12:33, контрольная работа
Задание:
1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.
2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.
3. Рассчитайте параметры а1 и а0 парной линейной функции и линейно-логарифмической функции
4. Оцените тесноту связи с помощью показателей корреляции (ryx и ηylnx) и детерминации (r2yx и η2ylnx), проанализируйте их значения.
5. Надёжность уравнений в целом оцените через F -критерий Фишера для уровня значимости a=0,05.
6. На основе оценочных характеристик выберите лучшее уравнение регрессии и поясните свой выбор.
7. По лучшему уравнению регрессии рассчитайте теоретические значения результата ( ), по ним постройте теоретическую линию регрессии и определите среднюю ошибку аппроксимации - ε'ср., оцените её величину.
8. Рассчитайте прогнозное значение результата , если прогнозное значение фактора ( ) составит 1,023 от среднего уровня ( ).
9. Рассчитайте интегральную и предельную ошибки прогноза (для a=0,05), определите доверительный интервал прогноза ( ; ), а также диапазон верхней и нижней границ доверительного интервала ( ), оцените точность выполненного прогноза.
6. Основные
выводы оформите аналитической запиской.
Решение:
1.Представленные в условии задачи значения линейных коэффициентов парной корреляции позволяют установить, что оборот розничной торговли Y более тесно связан с годовым доходом всего населения X3 ( ) и с - долей лиц с высшим и незаконченным образованием среди занятых X2 ( ); наименее тесно результат Y связан с - кредитами, предоставленными в 2000 году предприятиям, организациям, банкам и физическим лицам X1. Поэтому, в силу небольшой информативности фактора, предполагаем, что его можно исключить из дальнейшего анализа. Проверим наши предположения с помощью анализа матрицы коэффициентов частной корреляции. Очевидно, что наиболее тесная связь результата Y с годовым доходом всего населения ( ) и долей населения с высшим и незаконченным высшим образованием среди занятых, % ( ) и наименее тесно результат Y связан с - кредитами, предоставленными в 2000 году предприятиям, организациям, банкам и физическим лицам.
(
). Поэтому
для уточнения окончательного вывода
выполним расчёт серии коэффициентов
частной корреляции Y с двумя возможными
комбинациями факторных признаков: для
Y с X1
и с X3,
а также для Y
c X2 и X3.
Расчёты частных коэффициентов корреляции выполним по следующим формулам:
Как видим,
факторы X₁
и X₃,
действительно, тесно
связаны с результатом,
и между собой сильно
взаимодействуют.
Расчёт аналогичных показателей по
следующей паре факторов приводит к иным
результатам:
В данном случае,
межфакторное взаимодействие оценивается
как заметное (
), а фактор
слабо связан с результатом. Таким образом,
первая из рассмотренных пар факторных
признаков (X1 и X3 ) в большей мере отвечает
требованиям, предъявляемым МНК к исходным
данным и, в частности, к отсутствию межфакторного
взаимодействия. Указанные обстоятельства
позволяют использовать X1 и X3 в качестве
информативных факторов уравнения множественной
регрессии.
2. При построении двухфакторной регрессионной
модели воспользуемся для упрощения расчётов
методом стандартизованных переменных.
В этом случае, исходное уравнение приобретает
вид:
. Выполним
расчёт - коэффициентов, используя значения
известных по условию линейных коэффициентов
парной корреляции.
В результате получено уравнение в стандартизованном масштабе:
Параметры данного
уравнения представляют собой относительные
оценки силы влияния каждого из факторов
на результат. При
увеличении первого
фактора на одну сигму
-pea
(от
своей средней) оборот
розничной торговли
увеличивается на 0,235
своей сигмы (
);
с увеличением второго
фактора на результат
увеличивается на 0,928
. Сравнивая b-коэффициентов, определяем,
какой из признаков влияет на результат
сильнее, а какой – слабее.
В данном случае,
увеличение розничного
товарооборота происходит,
прежде всего, под влиянием
третьего фактора и
в меньшей степени –
в результате увеличения
первого фактора.
3. Используя значения - коэффициентов,
можно рассчитать параметров уравнения
в естественной форме:
В конечном счёте,
имеем уравнение:
. По значениям коэффициентов регрессии
можно судить о том, на какую абсолютную
величину изменяется результат при изменении
каждого фактора на единицу (от своей средней).
С увеличением первого
фактора на 1 единицу
результат увеличивается
на 6,258 млрд. руб., с увеличением
третьего фактора на 1
единицу увеличивается
на 0,409 млрд. руб.
Но так как признаки-факторы измеряются
в разных единицах, сравнивать значения
их коэффициентов регрессии не следует.
Точную оценку силы связи факторов с результатом
дают коэффициенты эластичности и β
- коэффициенты.
4. Для сравнительной оценки силы связи
выполним расчёт средних коэффициентов
эластичности. С их помощью можно определить,
на сколько процентов изменяется результат
при изменении фактора на 1% (от своего
среднего значения). В нашем случае, расчёт
показал, что первого фактора на розничный
товарооборот оказалось менее сильным
по сравнению с влиянием третьего фактора:
с ростом первого фактора
на 1% розничный товарооборот
увеличивается на 0,098%,
а при увеличении
третьего фактора на 1%
розничный товарооборот
уменьшается на 0,74%. Различия в силе
влияния весьма значительны: первый фактор
влияет на результат в семь с лишним раз
слабее, чем третий. Поэтому регулирование
величины розничного товарооборота через
третий фактор будет более результативным,
чем через первый.
6. Тесноту выявленной зависимости розничного товарооборота от инвестиций в экономику региона и от численности населения оценивают множественный коэффициент корреляции и детерминации. Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и β – коэффициентов: В нашем случае 2-х факторной зависимости расчёт строится следующим образом:
Как показали расчёты,
установлена весьма
тесная зависимость
розничного товарооборота
от первого и третьего
фактора. Это означает,
что 92,2% вариации розничного
товарооборота определены
вариацией данных факторов.
Оставшиеся 7,8% вариации
результата сформировались
под влиянием прочих
причин, роль которых
незначительна.
7. Оценка статистической значимости
или надёжности установленной формы зависимости,
её параметров, оценок её силы и тесноты
является важным этапом анализа результатов.
Для выполнения оценки формулируется
нулевая гипотеза, которая рассматривает
предположение о случайной природе полученных
результатов. То есть
Для проверки
выдвинутой нулевой гипотезы используется
F-критерия Фишера. Его фактическое значение
определяется, исходя из соотношения факторной
и остаточной дисперсий и их степеней
свободы: d.f.1=k и d.f.2=n-k-1; где: n –число
изучаемых единиц; k – число ограничений,
которые накладываются на исходные данные
при расчёте данного показателя. Здесь
k равно числу факторов уравнения, то
есть k=2.
В нашем случае, когда рассматривается зависимость результата от двух факторов, расчёт выглядит следующим образом:
Фактическое значение
критерия показывает,
что детерминация,
сформированная под
воздействием двух изучаемых
факторов, почти в 30
раз больше, чем детерминация,
связанная с действием
прочих причин.
Очевидно, что
подобное соотношение
случайно сформироваться
не может, а является
результатом влияния
существенных, систематических
факторов.
Для принятия обоснованного решения
Fфактич. сравнивается
с Fтабл., которое
формируется случайно и зависит степеней
свободы факторной (d.f.1 = k) и остаточной
(d.f.2 = n-k-1) дисперсий, а также от уровня
значимости α=0,05. В нашем примере, где
d.f.1=k= 2 и d.f.2=n-k-1 = 8-2-1=5 при α=0,05
Fтабл = 5,79. В силу того, что Fфактич.
=29,551> Fтабл. = 5,79,
можно с высокой степенью
надёжности отклонить
нулевую гипотезу, а в качестве альтернативы
– согласиться с утверждением, что
проверяемые параметры
множественной регрессионной
модели неслучайны,
что коэффициенты
уравнения и показатели
тесноты связи не являются
случайными величинами.
8. Техническая часть прогнозных расчётов по уравнению множественной регрессии сравнительно проста. Достаточно определить прогнозные значения каждого факторного признака , подставить их в уравнение и выполнить с ними расчёт прогнозного значения результата - . При этом следует помнить, что требования к точности и надёжности прогноза предъявляют к используемой модели повышенные требования. В нашем случае, прогнозное значение каждого из факторов, то есть и , получено на основе средней величины:
После подстановки в уравнение получаем следующий результат:
Если
кредиты, предоставленные
в 2000 году предприятиям,
организациям, банкам
и физическим лицам
возрастут до 0,232
млрд. руб., а годовой
доход всего населения
составит 26,789 млрд. руб.,
тогда следует ожидать,
что розничный товарооборот
возрастёт до 14,615 млрд.
руб., то есть увеличится
на 7,2% от своего среднего
уровня.
Задача №3.
Для проверки рабочих
гипотез (№1 и №2) о связи социально-
Y1 – среднегодовая стоимость основных фондов в экономике, млрд. руб.;
Y2 – стоимость валового регионального продукта, млрд. руб.;
X1 – инвестиции прошлого, 1999, года в основной капитал, млрд. руб.;
X2 – кредиты прошлого, 1999, года, предоставленные предприятиям, организациям, банкам и физическим лицам, млрд. руб.
X3 – среднегодовая численность занятых в экономике, млн. чел.
Рабочие гипотезы:
Предварительный анализ исходных данных по 18 территориям выявил наличие трёх территорий (г. Москва, Московская обл., Воронежская обл.) с аномальными значениями признаков. Эти единицы должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных аномальных единиц.
При обработке
исходных данных получены следующие
значения линейных коэффициентов парной
корреляции, средних и средних квадратических
отклонений -σ:
N=15.
Для проверки рабочей гипотезы №1. Для проверки рабочей гипотезы №2.
Y1 | X1 | X2 | Y2 | X3 | |||
Y1 | 1 | 0,6631 | 0,7477 | Y2 | 1 | 0,7863 | 0,7337 |
X1 | 0,6631 | 1 | 0,4747 | 0,7863 | 1 | 0,6177 | |
X2 | 0,7477 | 0,4747 | 1 | X3 | 0,7337 | 0,6177 | 1 |
Средняя | 115,83 | 0,1615 | 3,75 | Средняя | 23,77 | 115,83 | 0,570 |
30,0303 | 0,1400 | 1,6836 | 7,2743 | 30,0303 | 0,1160 |
Задание:
1. Составьте систему уравнений в соответствии с выдвинутыми рабочими гипотезами.
2. Определите вид уравнений и системы.
3. На основе приведённых в условии значений матриц коэффициентов парной корреляции, средних и средних квадратических отклонений: