Автор работы: Пользователь скрыл имя, 29 Октября 2017 в 04:46, контрольная работа
В качестве статистических наблюдений можно использовать данные статистических исследований, опубликованные в научных журналах и на специализированных сайтах. Затем необходимо провести обработку данных по следующей схеме:
Построить поле корреляции и сформулировать гипотезу о форме связи.
Рассчитать параметры уравнений линейной, степенной и экспоненциальной парной регрессий.
Оценить тесноту связи с помощью показателей корреляции и детерминации.
Оценить качество уравнений с помощью средней ошибки аппроксимации.
С помощью F-критерия Фишера оценить статистическую надежность результатов регрессионного моделирования. Выбрать лучшее уравнение регрессии и дать его обоснование.
Рассчитать прогнозное значение результата, при условии , что прогнозное значение фактора увеличится на 10% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости 0,05.
Творческое задание № 5
«Анализ зависимости валового дохода от стоимости основных фондов предприятия»
Пояснение к ТЗ
Для выполнения работы необходимо собрать или использовать готовые данные о величинах валового дохода различных предприятий и организаций и стоимостях их основных фондов. Объем выборки должен содержать не менее 15 наблюдений. В качестве статистических наблюдений можно использовать данные статистических исследований, опубликованные в научных журналах и на специализированных сайтах. Затем необходимо провести обработку данных по следующей схеме:
Работу нужно выполнить в двух вариантах. Вариант 1: работа выполняется вручную, все необходимые расчеты проводятся с помощью калькулятора или ППП Excel (но в функции калькулятора). Вариант 2: Решение задачи с помощью ППП Excel с использованием статистических функций. В заключении сравнение результатов, полученных в двух вариантах расчетов.
Предприятия легкой промышленности (на 01.01.2017). Источник данных «Центр раскрытия корпоративной информации» (e-disclosure.ru).
тыс. руб.
№ |
Название |
Город |
Величина валового дохода |
Остаточная стоимость основных фондов |
ОАО "ДО "Орел" |
г. Домодедово |
32769 |
10069 | |
АО "Волжанка" |
г. Саратов |
33932 |
26140 | |
ОАО "Заря" |
г. Владивосток |
130874 |
506456 | |
ПАО "Митра" |
г.Горбатов |
19123 |
6659 | |
ОАО "Коломнатекмаш" |
г. Коломна |
93540 |
112809 | |
ОАО "Обувная фабрика "Спартак" |
г.Казань |
559051 |
1127041 | |
ОАО "Павловопосадская платочная мануфактура" |
г. Павловский Посад |
846064 |
172961 | |
ОАО "Адонис" |
г.Казань |
41182 |
0 | |
АО "ТП "КРАСНЫЙ ВОСТОК" |
г. Москва |
41875 |
2495 | |
ОАО "Трехгорная мануфактура" |
г. Москва |
1437649 |
317539 | |
АО "Красный Перекоп" |
г.Ярославль |
456915 |
68411 | |
ОАО "Павлово-Посадский камвольщик" |
г.Павловский Посад |
282241 |
57020 | |
ОАО "Никологорская швейная фабрика" |
п. Никологоры |
2605 |
2660 | |
ОАО БШФ "Россиянка" |
г. Белгород |
64742 |
12509 | |
ПАО «Победа труда» |
г. Москва |
94020 |
23295 |
Величина валового дохода, Y |
Остаточная стоимость основных фондов, X |
32769 |
10069 |
33932 |
26140 |
130874 |
506456 |
19123 |
6659 |
93540 |
112809 |
559051 |
1127041 |
846064 |
172961 |
41182 |
0 |
41875 |
2495 |
1437649 |
317539 |
456915 |
68411 |
282241 |
57020 |
2605 |
2660 |
64742 |
12509 |
94020 |
23295 |
По графику видно, что зависимость валового дохода от остаточной стоимости ОФ является нелинейной.
Линейное уравнение регрессии имеет вид y = bx + a
Система нормальных уравнений.
an + b∑x = ∑y
a∑x + b∑x2 = ∑yx
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
x |
y |
x2 |
y2 |
x • y |
10069 |
32769 |
101384761 |
1073807361 |
329951061 |
26140 |
33932 |
683299600 |
1151380624 |
886982480 |
506456 |
130874 |
256497679936 |
17128003876 |
66281922544 |
6659 |
19123 |
44342281 |
365689129 |
127340057 |
112809 |
93540 |
12725870481 |
8749731600 |
10552153860 |
1127041 |
559051 |
1270221415681 |
312538020601 |
630073398091 |
172961 |
846064 |
29915507521 |
715824292096 |
146336075504 |
0 |
41182 |
0 |
1695957124 |
0 |
2495 |
41875 |
6225025 |
1753515625 |
104478125 |
317539 |
1437649 |
100831016521 |
2066834647201 |
456509625811 |
68411 |
456915 |
4680064921 |
208771317225 |
31258012065 |
57020 |
282241 |
3251280400 |
79659982081 |
16093381820 |
2660 |
2605 |
7075600 |
6786025 |
6929300 |
12509 |
64742 |
156475081 |
4191526564 |
809857678 |
23295 |
94020 |
542657025 |
8839760400 |
2190195900 |
2446064 |
4136582 |
1679664294834 |
3428584417532 |
1361560304296 |
Для наших данных система уравнений имеет вид
15a + 2446064 b = 4136582
2446064 a + 1679664294834 b = 1361560304296
Домножим уравнение (1) системы на (-163070.93), получим систему, которую решим методом алгебраического сложения.
-2446064a -398881931319.52 b = -674556273761.26
2446064 a + 1679664294834 b = 1361560304296
Получаем:
1280782363514.5 b = 687004030534.74
Откуда b = 0.5364
Теперь найдем коэффициент «a» из уравнения (1):
15a + 2446064 b = 4136582
15a + 2446064*0.5364 = 4136582
15a = 2824527.87
a = 188301.8582
Получаем эмпирические коэффициенты регрессии: b = 0.5364, a = 188301.8582
Уравнение регрессии: y = 0.5364 x + 188301.8582
Это означает, что с ростом основных средств на 1тыс. руб., валовой доход растет на 0.5364 тыс. руб.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
3. Коэффициент корреляции.
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между валовым доходом и величиной основных фондов умеренная и прямая.
4.
Оценим качество уравнения
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
В среднем, расчетные значения отклоняются от фактических на 718.21%. Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве регрессии.
Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака.
Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
R2= 0.4012 = 0.1611, т.е. в 16.11% случаев изменения стоимости ОФ приводят к изменению величины валового дохода. Другими словами - точность подбора уравнения регрессии - низкая. Остальные 83.89% изменения валового дохода Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
x |
y |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
|y - yx|:y |
10069 |
32769 |
193702.81 |
59050522809.816 |
25899691109.342 |
4.911 |
26140 |
33932 |
202323.198 |
58486650090.683 |
28355595621.465 |
4.963 |
506456 |
130874 |
459961.833 |
20995469043.484 |
108298801884.24 |
2.515 |
6659 |
19123 |
191873.706 |
65868777640.749 |
29842806448.572 |
9.034 |
112809 |
93540 |
248811.932 |
33208550419.217 |
24109372977.899 |
1.66 |
1127041 |
559051 |
792839.922 |
80246916299.953 |
54657260139.711 |
0.418 |
172961 |
846064 |
281077.106 |
325232813186.16 |
319210190335.69 |
0.668 |
0 |
41182 |
188301.858 |
55032530657.35 |
21644252684.674 |
3.572 |
2495 |
41875 |
189640.161 |
54707868981.55 |
21834542903.369 |
3.529 |
317539 |
1437649 |
358627.882 |
1349957853295.2 |
1164286572833.2 |
0.751 |
68411 |
456915 |
224997.11 |
32812738144.219 |
53785907603.195 |
0.508 |
57020 |
282241 |
218887.046 |
41846235.951 |
4013723510.571 |
0.224 |
2660 |
2605 |
189728.666 |
74620282733.549 |
35015266506.994 |
71.833 |
12509 |
64742 |
195011.611 |
44533717174.683 |
16970171588.669 |
2.012 |
23295 |
94020 |
200797.157 |
33033837971.217 |
11401361290.242 |
1.136 |
2446064 |
4136582 |
4136582 |
2287830374683.8 |
1919325517437.8 |
107.732 |
5. Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.
Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.
где m – число факторов в модели.
Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
5.1. Выдвигается
нулевая гипотеза о том, что
уравнение в целом
5.2. Далее
определяют фактическое
или по формуле:
где m=1 для парной регрессии.
5.3. Табличное
значение определяется по
Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α. Уровень значимости α - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05.
5.4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
Табличное значение критерия со степенями свободы k1=1 и k2=13, Fтабл = 4.67
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Степенное уравнение регрессии имеет вид y = a xb
Для наших данных система уравнений имеет вид
14a + 148.91 b = 161.6
148.91 a + 1631.3 b = 1752.77
Получаем эмпирические коэффициенты регрессии: b = 0.7157, a = 3.9302
Уравнение регрессии (эмпирическое уравнение регрессии):
Информация о работе Анализ зависимости валового дохода от стоимости основных фондов предприятия