Автор работы: Пользователь скрыл имя, 04 Сентября 2009 в 18:32, Не определен
населением Оренбургской области
Y – объём платных услуг на душу населения (рублей);
Х1 –среднемесячная
номинальная начисленная
Х2 –
среднесписочная численность
Х3 – оборот розничной торговли на душу населения (рублей).
1. Построим уравнение множественной линейной регрессии следующего вида:
Проведем
регрессионный анализ данных факторов.
Результаты представим в таблице 3.1
Таблица 3.1 – Результаты регрессионного анализа факторов Х1, Х2, Х3
Коэффициенты | |
Y-пересечение | -4472,921362 |
Заработная плата работников, Х1 | 1,373900722 |
Численность работников, X2 | -0,040920982 |
Оборот розничной торговли на душу населения, Х3 | 0,15324022 |
Построим
уравнение множественной
Известно, что коэффициент регрессии показывает среднее изменение результативного признака с изменением на 1 единицу своего измерения данного фактора при условии постоянства всех остальных.
Таким образом, коэффициент регрессии:
Другими
словами это означает, что величина
объёма платных услуг на душу населения
в среднем по совокупности увеличивалась
на 1,37 руб. при увеличении заработной платы
работников на 1 руб., уменьшалась в среднем
на 0,04 руб. при возрастании численности
работников на 1 человека и увеличивалась
на 0,15 руб. при росте оборота розничной
торговли на душу населения на 1 руб.
2. Дадим сравнительную оценку силы связи факторов с результатом с помощью средних коэффициентов эластичности.
Рассчитаем средние коэффициенты эластичности по формуле:
Средние
значения признаков получим с
помощью инструмента анализа
данных Описательная
статистика (таблица 3.2).
Таблица 3.2 – Средние значения признаков
У | Х1 | Х2 | Х3 | ||||
Среднее | 4876,374 | Среднее | 5682,511 | Среднее | 12278,23 | Среднее | 13341,98 |
Результаты вычисления соответствующих показателей для каждого признака:
По
значениям средних
Проинтерпретировав
средний коэффициент
Проинтерпретировав
средний коэффициент
Проинтерпретировав
средний коэффициент
3. Оценим с помощью F-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.
Оценку надежности уравнения регрессии в целом и показатели тесноты связи дает F-критерий Фишера:
Для проверки значимости уравнения выдвигаем две гипотезы:
H0: уравнение регрессии является статистически не значимым.
H1: уравнение регрессии является статистически значимым.
Таблица 3.3 – Дисперсионный анализ данных
df | SS | MS | F | Значимость F | |
Регрессия | 3 | 5,78E+08 | 1,93E+08 | 75,35834 | 3,69E-17 |
Остаток | 43 | 1,1E+08 | 2554841 | ||
Итого | 46 | 6,87E+08 |
По данным таблицы дисперсионного анализа Fфакт. =75,36. Вероятность случайно получить такое значение F-критерия составляет 3,69Е-17, что не превышает допустимый уровень значимости 5 %, об этом свидетельствует величина P- значение из этой же таблицы. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .
4. Оценим статистическую значимость коэффициентов регрессии с помощью t-критерия Стьюдента.
Выдвигаем две гипотезы:
H0: коэффициенты регрессии является статистически не значимыми, т.е. равны 0.
H1: коэффициенты регрессии является статистически значимыми, т.е. отличны от 0.
Таблица 3.4 – Результаты регрессионного анализа факторов Х1, Х2, Х3
Стандартная ошибка | t-статистика | |
Y-пересечение | 761,5746 | -5,87325 |
Заработная плата работников, Х1 | 0,134205 | 10,2373 |
Численность работников, X2 | 0,022423 | -1,82499 |
Оборот розничной торговли на душу населения, Х3 | 0,046465 | 3,297959 |
Значения случайных ошибок параметров b1, b2, b3 c учетом округления (таблица 3.4):
Если значения t-критерия больше 2,09, можно сделать вывод о существенности параметра, который формируется под воздействием неслучайных причин.
параметр b статистически значим;
параметр b статистически не значим;
параметр b статистически значим.
5. Оценим качество уравнения через среднюю ошибку аппроксимации.
Рассчитаем среднюю ошибку аппроксимации по формуле средней арифметической простой:
Но для этого еще найдем:
Получим:
Таким
образом, фактические значения результативного
признака отличаются от теоретических
значений на 33,1 %. Следовательно, построенная
модель является удовлетворительной.
6. Рассчитаем матрицу парных коэффициентов корреляции и отберем информативные факторы в модели. Укажем коллинеарные факторы.
Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.
Таблица 3.5 – Матрица коэффициентов парной корреляции
Y | Х1 | X2 | Х3 | |
Y | 1 | |||
Х1 | 0,886194 | 1 | ||
X2 | 0,590571 | 0,553515 | 1 | |
Х3 | 0,670447 | 0,564597 | 0,903082 | 1 |
Из таблицы 3.5 можно заметить, что факторы x2 и x3 мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,75. Таким образом, можно сказать, что они дублируют друг друга.
При
отборе факторов в модель предпочтение
отдается фактору, который при достаточно
тесной связи с результатом имеет
наименьшую тесноту связи с другими
факторами. В нашем примере получаем,
информативными факторами являются: x1
и x3.
7. Построим модель в естественной форме только с информативными факторами и оценим ее параметры:
Построим
уравнение множественной
Коэффициенты
возьмём из таблицы 3.6:
Таблица 3.6 – Результаты регрессионного анализа факторов Х1, Х3,
Коэффициенты | |
Y-пересечение | -3832,012418 |
Заработная плата работников, Х1 | 1,343748976 |
Оборот розничной торговли на душу населения, Х3 | 0,080386804 |
Получаем уравнение следующего вида:
Оно показывает, что при увеличении заработной платы работников на 1 руб. объём платных услуг на душу населения увеличивается на 1,34 руб., при увеличении оборота розничной торговли на душу населения на 1 руб. объём платных услуг на душу населения увеличивается на 0,08 руб.
Уравнение
в целом, а также его параметры
являются статистически значимыми.
8. Построим модель в стандартизированном масштабе и проинтерпретируем её параметры.
Уравнение в стандартизированном масштабе имеет вид:
Расчет β – коэффициентов выполним по формулам:
Парные коэффициенты
корреляции берутся из матрицы (таблица
3.7).
Таблица 3.7 – Матрица коэффициентов парной корреляции
Информация о работе Статистическое изучение потребления платных услуг