Автор работы: Пользователь скрыл имя, 11 Октября 2010 в 21:30, Не определен
Прогнозирование уровня жизни населения с помощью регрессионной модели
5) организация лицензирования деятельности негосударственных структур, физических лиц и государственных служб, занимающихся оказанием социальных услуг населению;
6) обеспечение максимальной реализации принятых федеральных и областных программ социальной защиты населения, а также повышение минимального размера оплаты труда, максимальное приближение его к величине прожиточного минимума трудоспособного человека.
II. Практическая часть
§2.1. Построение регрессионной модели заработной платы
В практической части мы проведем прогнозирование одного из основных показателей уровня жизни - среднемесячной начисленной заработной платы с помощью многофакторного анализа. Анализ будем проводить по уровню образования работников.
Многофакторный анализ – метод исследования, при котором рассматривается более двух факторов одновременно. За результативный фактор у возьмем заработную плату в рублях всех работников за период I квартала 2009 года.
За х1- зарплату работников в рублях, имеющих высшее профессиональное образование;
За х2- зарплату работников в рублях, имеющих неполное высшее профессиональное образование;
За х3- зарплату работников в рублях, имеющих среднее профессиональное образование;
За ч4- зарплату работников в рублях, имеющих начальное профессиональное образование;
За х5- зарплату работников в рублях, имеющих среднее общее образование;
За х6- зарплату работников в рублях, имеющих основное общее образование;
За х5- зарплату работников в рублях, не имеющих основное общее образование;
В таблице
1 содержаться исходные данные.
Таблица 1.
Средняя начисленная заработная плата работников по уровню образования | ||||
январь | февраль | март | апрель | |
Все работники | 19786,42 | 19955,34 | 20452,57 | 20988,3 |
в том числе имеющие | 25966,98 | 26178,4 | 26399,8 | 26537,97 |
образование: | ||||
высшее профессиональное | ||||
неполное высшее профессиональное | 17541,3 | 17939,51 | 18246,43 | 1845,37 |
среднее профессиональное | 17886,7 | 18136,98 | 18351,2 | 18537,76 |
начальное профессиональное | 17987,3 | 18275,52 | 18492,87 | 18717,17 |
среднее (полное) общее | 17163,3 | 17512,3 | 17726,64 | 18110,21 |
основное общее | 15305,31 | 15750,2 | 15988,35 | 16067,3 |
не имеют основного общего | 13443,11 | 13736,3 | 13997,2 | 14165,3 |
Целями исследования зависимости между признаками являются доказательство наличия связи между признаками и изучение этой связи. Для доказательства наличия связи между двумя случайными величинами Х и У применяют корреляционный анализ. Если совместное распределение Х и У является нормальным, то статистические выводы основывают на выборочном коэффициенте линейной корреляции.
Проводим корреляционный анализ с помощью средств MS Excel.
Для построения матрицы коэффициентов парной корреляции необходимо выбирать команду меню Сервис/Анализ данных/Корреляция. Получаем матрицу коэффициентов парной корреляции:
Y | X1 | X2 | X3 | X4 | X5 | Х6 | Х7 | |
Y | 1 | |||||||
X1 | 0,969931131 | 1 | ||||||
X2 | 0,7835509 | 0,48104101 | 1 | |||||
X3 | 0,923776162 | 0,9886926 | 0,492782141 | 1 | ||||
X4 | 0,558603886 | 0,5149579 | 0,928738769 | 0,4412926 | 1 | |||
X5 | 0,983930312 | 0,91254885 | 0,658367796 | 0,8590448 | 0,81163832 | 1 | ||
Х6 | 0,957355231 | 0,94062346 | 0,619255408 | 0,8919184 | 0,76330753 | 0,996909112 | 1 | |
Х7 | 0,764378766 | 0,97883455 | 0,299515062 | 0,6317487 | 0,030756 | 0,496059331 | 0,550741128 | 1 |
Одним из условий регрессионной модели является предположение о функциональной независимости объясняющих переменных. Связь между факторами называется мультиколлинеарностью, которая делает вычисление параметров модели либо невозможным, либо затрудняет содержательную интерпретацию параметров модели. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0.8. Дальнейший анализ модели проводим без X1, Х3, X4, Х6, X7.
Расчет коэффициентов линейной регрессии.
Для линейной аппроксимации в Excel существует функция ЛИНЕЙН(изв. зн. Y, изв. зн. X, константа, статистика) она возвращает массив значений описывающих кривую вида:
В результате получили полную статистическую информацию при аргументе Константа равном 1:
Линейная зависимость | ||
0.645 | 0.176 | 229.123 |
0.039 | 0.038 | 94.969 |
0.963 | 115.657 | #Н/Д |
441.156 | 34 | #Н/Д |
11802358 | 454805 | #Н/Д |
Полученные числа
имеют следующий смысл:
mn | mn-1 | … | b |
Sen | Sen-1 | … | Seb |
R2 | Sey | ||
F | Df | ||
Ssreg | Ssresid |
Se – стандартная ошибка для коэффициента m
Seb – стандартная ошибка для свободного члена b
R2 – коэффициент детерминированности, который показывает как близко уравнение описывает исходные данные. Чем ближе он к 1, тем больше сходится теоретическая зависимость и экспериментальные данные.
Sey – стандартная ошибка для y
F – критерий Фишера определяет случайная или нет взаимосвязь между зависимой и независимой переменными
Df – степень свободы системы
Ssreg – регрессионная сумма квадратов
Ssresid – остаточная сумма квадратов
Аналогичным образом построим линейную регрессионную зависимость при аргументе Константа равном 0:
Линейная зависимость | ||
0.728 | 0.146 | 0 |
0.021 | 0.039 | #Н/Д |
0.9980 | 123.365 | #Н/Д |
8925.124 | 35 | #Н/Д |
2.7E+08 | 532666 | #Н/Д |
Для проведения регрессионного анализа выберем пункт меню Сервис/Анализ данных/Регрессия.
Получаем следующие результаты:
Регрессионная статистика | |
Множественный R | 0.981 |
R-квадрат | 0.963 |
Нормированный R-квадрат | 0.961 |
Стандартная ошибка | 115.657 |
Наблюдения | 37 |
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 2 | 11802358 | 5901179 | 441.156 | 4.79E-25 |
Остаток | 34 | 454805.4 | 13376.63 | ||
Итого | 36 | 12257163 |
Коэффициенты | Стандартная ошибка |
t статистика |
P Значение |
Нижние 95% |
Верхние 95% |
Нижние 95.0% |
Верхние 95.0% | |
Y | 229.123 | 94.969 | 2.413 | 0.021 | 36.122 | 422.123 | 36.122 | 422.123 |
X2 | 0.176 | 0.038 | 4.597 | 0.000 | 0.098 | 0.255 | 0.098 | 0.255 |
X5 | 0.645 | 0.039 | 16.336 | 1.15E-17 | 0.565 | 0.726 | 0.565 | 0.726 |
Результаты, полученные при расчете с использованием инструмента Регрессия надстройки Пакет анализа, совпали с результатами, полученными при помощи функции ЛИНЕЙН при аргументе Константа имеющем значение ИСТИНА.
Для экспоненциальной аппроксимации в Excel существует функция ЛГРФПРИБЛ(изв. зн. Y, изв. зн. X, константа, статистика) она возвращает массив значений описывающих кривую вида:
Если значение
константы равно ИСТИНА то получена
полная статистическая информация:
Экспоненциальная зависимость | ||
1.0002 | 1.00007 | 1030.47 |
1.9E-05 | 0.000 | 0.046 |
0.940 | 0.057 | #Н/Д |
266.115 | 34 | #Н/Д |
1.702 | 0.109 | #Н/Д |
Информация о работе Прогнозирование уровня жизни населения России