Автор работы: Пользователь скрыл имя, 25 Апреля 2010 в 17:26, Не определен
3 лабораторные по статистике
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные о среднегодовой стоимости основных производственных фондов и выпуске продукции за год по 32-м предприятиям, выпускающим однотипную продукцию (выборка 10%-ная, механическая).
В статистическом исследовании эти предприятия выступают как единицы выборочной совокупности. Генеральную совокупность образуют все предприятия корпорации. Анализируемые признаки предприятий – Среднегодовая стоимость основных производственных фондов и Выпуск продукции – изучаемые признаки единиц совокупности.
Для автоматизации статистических расчетов используются средства электронных таблиц процессора Excel.
Результаты выполненных расчетов представлены в табл. 2.4 Рабочего файла.
Вывод:
Значение коэффициента η =…0,90…………………, что в соответствии с оценочной шкалой Чэддока говорит о весьма тесной…………………………степени связи изучаемых признаков.
Задача 4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа и оценка тесноты связи на основе линейного коэффициента корреляции r.
4.1.
Построение регрессионной
Инструмент Регрессия на основе исходных данных (xi , yi), производит расчет параметров а0 и а1 уравнения однофакторной линейной регрессии , а также вычисление ряда показателей, необходимых для проверки адекватности построенного уравнения исходным (фактическим) данным.
Примечание. В результате работы инструмента Регрессия получены четыре результативные таблицы (начиная с заданной ячейки А75). Эти таблицы выводятся в Рабочий файл без нумерации, поэтому необходимо присвоить им номера табл.2.5 – табл.2.8 в соответствии с их порядком.
Вывод:
Рассчитанные в табл.2.7 (ячейки В91 и В92) коэффициенты а0 и а1 позволяют построить линейную регрессионную модель связи изучаемых признаков в виде уравнения …-496,86+1,08х………………….
4.2. В случае линейности функции связи для оценки тесноты связи признаков X и Y, устанавливаемой по построенной модели, используется линейный коэффициент корреляции r.
Значение коэффициента корреляции r приводится в табл.2.5 в ячейке В78 (термин "Множественный R").
Вывод:
Значение коэффициента корреляции r =…0,91………… , что в соответствии с оценочной шкалой Чэддока говорит о ..….весьма тесной ………………………. степени связи изучаемых признаков.
Задача 5. Анализ адекватности и практической пригодности построенной линейной регрессионной модели.
Анализ
адекватности регрессионной модели
преследует цель оценить, насколько
построенная теоретическая
Оценка соответствия построенной регрессионной модели исходным (фактическим) значениям признаков X и Y выполняется в 4 этапа:
Так как коэффициенты уравнения а0 , а1 рассчитывались, исходя из значений признаков только для 30-ти пар (xi , yi), то полученные значения коэффициентов являются лишь приближенными оценками фактических параметров связи а0 , а1. Поэтому необходимо:
Для анализа коэффициентов а0, а1 линейного уравнения регрессии используется табл.2.7, в которой:
– значения коэффициентов а0, а1 приведены в ячейках В91 и В92 соответственно;
– рассчитанный
уровень значимости
– доверительные
интервалы коэффициентов с
5.1.1. Определение значимости коэффициентов уравнения
Уровень значимости – это величина α=1–Р, где Р – заданный уровень надежности (доверительная вероятность).
Режим работы инструмента Регрессия использует по умолчанию уровень надежности Р=0,95. Для этого уровня надежности уровень значимости равен α = 1 – 0,95 = 0,05. Этот уровень значимости считается заданным.
В инструменте Регрессия надстройки Пакет анализа для каждого из коэффициентов а0 и а1 вычисляется уровень его значимости αр, который указан в результативной таблице (табл.2.7 термин "Р-значение"). Если рассчитанный для коэффициентов а0, а1 уровень значимости αр, меньше заданного уровня значимости α= 0,05, то этот коэффициент признается неслучайным (т.е. типичным для генеральной совокупности), в противном случае – случайным.
Примечание. В случае, если признается случайным свободный член а0, то уравнение регрессии целесообразно построить заново без свободного члена а0. В этом случае в диалоговом окне Регрессия необходимо задать те же самые параметры за исключением лишь того, что следует активизировать флажок Константа-ноль (это означает, что модель будет строиться при условии а0=0). В лабораторной работе такой шаг не предусмотрен.
Если незначимым (случайным) является коэффициент регрессии а1, то взаимосвязь между признаками X и Y в принципе не может аппроксимироваться линейной моделью.
Вывод:
Для
свободного члена а0
уравнения регрессии рассчитанный уровень
значимости есть αр
=…0,107..………… Так как он (больше) заданного
уровня значимости α=0,05, то коэффициент
а0 признается
меньше(случайным).
типичным
Для
коэффициента регрессии а1
рассчитанный уровень значимости
есть αр
=……1,976…..…… Так как он больше)
заданного уровня значимости α=0,05,
то коэффициент а1
признается типичным (случайным).меньше
(
5.1.2. Зависимость доверительных интервалов коэффициентов уравнения от заданного уровня надежности
Доверительные интервалы коэффициентов а0, а1 построенного уравнения регрессии при уровнях надежности Р=0,95 и Р=0,683 представлены в табл.2.7, на основе которой формируется табл.2.9.
Таблица 2.9
Границы доверительных интервалов коэффициентов уравнения
Коэффициенты | Границы доверительных интервалов | |||
Для уровня надежности Р=0,95 | Для уровня надежности Р=0,683 | |||
нижняя | верхняя | нижняя | верхняя | |
а0 | -1109,69 | 115,95 | -801,67 | -192,06 |
а1 | -0,901 | 1,28 | 0,995 | 1,18 |
Вывод:
В
генеральной совокупности предприятий
значение коэффициента а0
следует ожидать с надежностью Р=0,95
в пределах …1109,69
а0
115,95., значение коэффициента
а1
в пределах -0,901
а1
1,28… Уменьшение уровня надежности
ведет к
(сужению) доверительных интервалов
коэффициентов уравнения.расширению
Практическую пригодность построенной модели можно охарактеризовать по величине линейного коэффициента корреляции r:
Пригодность
построенной регрессионной
В основе такой оценки лежит равенство R = r (имеющее место для линейных моделей связи), а также шкала Чэддока, устанавливающая качественную характеристику тесноты связи в зависимости от величины r.
Согласно шкале Чэддока высокая степень тесноты связи признаков достигается лишь при >0,7, т.е. при >0,7. Для индекса детерминации R2 это означает выполнение неравенства R2 >0,5.
При недостаточно тесной связи признаков X, Y (слабой, умеренной, заметной) имеет место неравенство 0,7, а следовательно, и неравенство .
С учетом вышесказанного, практическая пригодность построенной модели связи оценивается по величине R2 следующим образом:
Значение индекса детерминации R2 приводится в табл.2.5 в ячейке В79 (термин "R - квадрат").
Вывод:
Значение
линейного коэффициента корреляции
r и значение индекса детерминации
R2 согласно табл. 2.5 равны:
r =…0,913….…….., R2
=…0,833…..………. Поскольку
и
, то построенная линейная регрессионная
модель связи пригодна (дна) для практического
использования.не
приго
- Общая оценка адекватности регрессионной модели по F-критерию Фишера
Адекватность построенной регрессионной
модели фактическим данным (xi, yi) устанавливается по критерию Р.Фишера, оценивающему статистическую значимость (неслучайность) индекса детерминации R2. Рассчитанная для уравнения регрессии оценка значимости R2 приведена в табл.2.6 в ячейке F86 (термин "Значимость F"). Если она меньше заданного уровня значимости α=0,05, то величина R2 признается неслучайной и, следовательно, построенное уравнение регрессии может быть использовано как модель связи между признаками Х и Y для генеральной совокупности предприятий отрасли.
Вывод:
Рассчитанный уровень значимости αр индекса детерминации R2 есть αр=…1,98…………… Так как он
(больше) заданного уровня значимости α=0,05, то значение R2 признаетсяменьше(случайным) и модель связи между признаками Х и Y …-496,86+1,08х …………………типичным(неприменима) для генеральной совокупности предприятий отрасли в целом.применима
- Оценка погрешности регрессионной модели
Погрешность регрессионной модели можно оценить по величине стандартной ошибки построенного линейного уравнения регрессии . Величина ошибки оценивается как среднее квадратическое отклонение по совокупности отклонений исходных (фактических) значений yi признака Y от его теоретических значений , рассчитанных по построенной модели.
Погрешность регрессионной модели выражается в процентах и рассчитывается как величина .100.
В адекватных моделях погрешность не должна превышать 12%-15%.
Значение приводится в выходной таблице "Регрессионная статистика" (табл.2.5) в ячейке В81 (термин "Стандартная ошибка"), значение – в таблице описательных статистик (ЛР-1, Лист 1, табл.3, столбец 2).
Вывод:
Погрешность линейной регрессионной модели составляет .100=__275,2427/_2999,97_.100=
…..9,17……..%, что подтверждает -496,86+1,08х……………………………(не) адекватность построенной моделиподтверждает
Задача 6. Дать экономическую интерпретацию:
1) коэффициента регрессии а1;
3) остаточных величин i.
2) коэффициента эластичности КЭ;
6.1. Экономическая интерпретация коэффициента регрессии а1
В случае линейного уравнения регрессии =a0+a1x величина коэффициента регрессии a1 показывает, на сколько в среднем (в абсолютном выражении) изменяется значение результативного признака Y при изменении фактора Х на единицу его измерения. Знак при a1 показывает направление этого изменения.
Вывод:
Коэффициент регрессии а1 =…1,08…………….. показывает, что при увеличении факторного признака Среднегодовая стоимость основных производственных фондов на 1 млн руб. значение результативного признака Выпуск продукции увеличивается (
) в среднем на 1,08……………..млн руб.уменьшается
6.2. Экономическая интерпретация коэффициента эластичности.
С целью расширения возможностей экономического анализа явления используется коэффициент эластичности , который измеряется в процентах и показывает, на сколько процентов изменяется в среднем результативный признак при изменении факторного признака на 1%.
Средние значения и приведены в таблице описательных статистик (ЛР-1, Лист 1, табл.3).
Расчет коэффициента эластичности:
=…1,08…….__3210/__2999,97_____ =…1,16……..%
Вывод:
Значение коэффициента эластичности Кэ=…1,16………. показывает, что при увеличении факторного признака Среднегодовая стоимость основных производственных фондов на 1% значение результативного признака Выпуск продукции увеличивается (уменьшается) в среднем на …1,16…….%.
6.3. Экономическая интерпретация остаточных величин εi
Каждый их остатков характеризует отклонение фактического значения yi от теоретического значения , рассчитанного по построенной регрессионной модели и определяющего, какого среднего значения следует ожидать, когда фактор Х принимает значение xi.
Анализируя остатки, можно сделать ряд практических выводов, касающихся выпуска продукции на рассматриваемых предприятиях отрасли.
Значения остатков i (таблица остатков из диапазона А98:С128) имеют как положительные, так и отрицательные отклонения от ожидаемого в среднем объема выпуска продукции (которые в итоге уравновешиваются, т.е. ).
Экономический интерес представляют наибольшие расхождения между фактическим объемом выпускаемой продукции yi и ожидаемым усредненным объемом .
Вывод:
Согласно таблице остатков максимальное превышение ожидаемого среднего объема выпускаемой продукции имеют три предприятия - с номерами…6…, 20……, …27….., а максимальные отрицательные отклонения - три предприятия с номерами……8, …24…, …26….. .Именно эти шесть предприятий подлежат дальнейшему экономическому анализу для выяснения причин наибольших отклонений объема выпускаемой ими продукции от ожидаемого среднего объема и выявления резервов роста производства.
Задача 7. Нахождение наиболее адекватного нелинейного уравнения регрессии с помощью средств инструмента Мастер диаграмм.
Уравнения регрессии и их графики построены для 3-х видов нелинейной зависимости между признаками и представлены на диаграмме 2.1 Рабочего файла.
Уравнения регрессии и соответствующие им индексы детерминации R2 приведены в табл.2.10 (при заполнении данной таблицы коэффициенты уравнений необходимо указывать не в компьютерном формате, а в общепринятой десятичной форме чисел).
Таблица 2.10
Регрессионные модели связи
Вид уравнения Уравнение регрессии Индекс детерминации R2
Полином 2-го порядка 7Е-05х2+0,670х+146,8 0,835 Полином 3-го порядка 1Е-0,7х3-0,001х2+5,042х-4285 0,838 Степенная функция 0,221х1,777 0,837 Выбор наиболее адекватного уравнения регрессии определяется максимальным значением индекса детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.
Вывод:
Максимальное значение индекса детерминации R2 =…0,838………............ Следовательно, наиболее адекватное исходным данным нелинейное уравнение регрессии имеет вид …1Е-0,7х3-0,001х2+5,042х-4285…
……………………
ПРИЛОЖЕНИЕ
Результативные таблицы и графики
Таблица 2.1 Номер варианта Исходные данные 44 Номер предприятия Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб. 1 2060,00 1610,00 2 2221,00 2139,00 3 2405,00 1840,00 4 2474,00 2369,00 5 2566,00 2530,00 6 2612,00 2668,00 7 2796,00 2277,00 8 2865,00 2185,00 9 2911,00 2599,00 10 3003,00 2898,00 12 3026,00 3082,00 13 3095,00 2829,00 14 3141,00 2967,00 15 3164,00 3220,00 16 3233,00 2875,00 17 3256,00 2944,00 18 3325,00 2760,00 19 3325,00 3358,00 20 3325,00 2990,00 21 3417,00 3726,00 22 3555,00 2990,00 23 3601,00 3496,00 24 3624,00 3703,00 25 3647,00 2990,00 26 3716,00 3427,00 27 3739,00 3151,00 28 3808,00 4071,00 29 3969,00 3910,00 31 4061,00 4025,00 32 4360,00 4370,00 Таблица 2.2 Зависимость выпуска продукции от среднегодовой стоимости основных фондов Номер группы Группы предприятий по стоимости основеных фондов Число предприятий Выпуск продукции Всего В среднем
на одно
предприятие1 2060-2520 4 7958,00 1989,50 2 2520-2980 5 12259,00 2451,80 3 2980-3440 11 33649,00 3059,00 4 3440-3900 7 23828,00 3404,00 5 3900-4360 3 12305,00 4101,67 Итого 30 89999,00 2999,97 Таблица 2.3 Показатели внутригрупповой вариации Номер группы Группы предприятий по стоимости основеных фондов Число предприятий Внутригрупповая дисперсия 1 2060-2520 4 83185,25 2 2520-2980 5 35252,56 3 2980-3440 11 71751,64 4 3440-3900 7 135726,29 5 3900-4360 3 38205,56 Итого 30 Таблица 2.4 Показатели дисперсии и эмпирического корреляционного отношения Общая дисперсия Средняя из внутригрупповых дисперсия Межгрупповая дисперсия Эмпирическое корреляционное отношение 425728,0322 78765,74889 346962,2833 0,902765617 Выходные таблицы ВЫВОД ИТОГОВ Регрессионная статистика Множественный R 0,91318826 R-квадрат 0,833912798 Нормированный R-квадрат 0,827981112 Стандартная ошибка 275,2427064 Наблюдения 30 Дисперсионный анализ df SS MS F Регрессия 1 10650601,64 10650601,64 140,5861384 Остаток 28 2121239,328 75758,54744 Итого 29 12771840,97 Коэффициенты Стандартная ошибка t-статистика P-Значение Y-пересечение -496,8634642 299,1700429 -1,660806207 0,107911312 Переменная X 1 1,089355181 0,09187519 11,85690257 1,97601E-12 ВЫВОД ОСТАТКА Наблюдение Предсказанное Y Остатки 1 1747,208209 -137,2082086 2 1922,594393 216,4056073 3 2123,035746 -283,035746 4 2198,201253 170,7987465 5 2298,42193 231,5780699 6 2348,532268 319,4677315 7 2548,973622 -271,9736218 8 2624,139129 -439,1391292 9 2674,249468 -75,24946756 10 2774,470144 123,5298558 11 2799,525313 282,4746866 12 2874,690821 -45,69082086 13 2924,801159 42,19884082 14 2949,856328 270,1436717 15 3025,021836 -150,0218358 16 3050,077005 -106,077005 17 3125,242512 -365,2425125 18 3125,242512 232,7574875 19 3125,242512 -135,2425125 20 3225,463189 500,5368109 21 3375,794204 -385,7942041 22 3425,904542 70,09545758 23 3450,959712 252,0402884 24 3476,014881 -486,0148807 25 3551,180388 -124,1803882 26 3576,235557 -425,2355574 27 3651,401065 419,5989351 28 3826,787249 83,21275099 29 3927,007926 97,99207434 30 4252,725125 117,2748752
Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel