Автор работы: Пользователь скрыл имя, 15 Января 2011 в 14:35, курсовая работа
Целью курсовой работы является:
•установить, влияют ли на самом деле на уровень рождаемости такие факторы как детская смертность, плодовитость женщин, рост сельского населения, население женщин и ожидаемый уровень жизни женщин.
•провести анализ зависимости между данными факторами и установить влияние на уровень рождаемости.
Предметом анализа являются года с 1989 по 2010 годы.
Введение 2
Постановка задача 5
Анализ задачи 6
Заключение. 18
Список использованной литературы. 20
Предикторы Х3 и Х5 описывают Уровень рождаемости на 74,9%.
Уравнение регрессии:
Уровень рождаемости = 0,3 - 0,017 Детская смертность
- 0,413 Ожидаемая продолжительность жизни при рождении + 5,15 Плодовитость женщин
+ 0,69 Женское население
R-Sq = 98,3%
Проанализировав все наилучшие модели, приходим к выводу, что лучшей моделью является модель с тремя предикторами Х1 (детская смертность), Х3 (плодовитость женщин) и Х5 (рост сельского населении), зависимость данных предикторов с Уровнем рождаемости составляет 0,95179, 0,44751, 0,68268 соответственно. Коэффициент детерминации R2 равен 97,6%, это значит, что эти предикторы описывают Уровень рождаемости (Y) на 97,6 %.
Хотя
модель со всеми предикторами имеет
самый высокий коэффициент
Проводя
дальнейшие исследования будет использована
модель с тремя предикторами (Х1,
Х3 и Х5).
Проверка F теста с заданным уровнем доверия.
F-тест проверяет значимость уравнения регрессии в целом, существует ли зависимость между постоянной и переменными.
Выдвигаем гипотезы:
H0: ρ2=0
H1: ρ2 >0
При нулевой гипотезе подтверждается, что между переменными и постоянной не существует зависимость.
Если же подтверждается первая гипотеза, то устанавливается, что между постоянной и переменными существует зависимость.
Для проверки теста
понадобятся значения Fstat и Ftab.
Fstat находим по следующей формуле:
Source DF SS MS F P
Regression 3 22,4816 7,4939 244,05 0,000
Residual Error 18 0,5527 0,0307
Total 21 23,0343
Найдем Ftab с уровнем доверия α= 0,05
Ftab=
3,15991
Сравнив
значения Ftab и Fstat приходим
в выводу, что Ftab< Fstat (3,15991<244,05),
значит, отвергается нулевая гипотеза,
и устанавливается, что выбранное уравнение
регрессии в значительной степени описывает
Уровень рождаемости на протяжении всех
годов, которые были выбраны к качестве
данных.
Тест на коэффициент регрессии проводится, чтобы установить все ли выбранные предикторы одинаково хорошо описывают модель во все периоды времени или всё же существуют некоторые отклонения.
Выдвинем следующие гипотезы:
H0: β1≠0
H1: β1=0
H0-нулевая гипотеза, которая предполагает, что между Уровнем рождаемости и Детской смертностью нет линейной зависимости
H1-альтернативная гипотеза, которая предполагает, что между ними есть линейная зависимость.
H0: β3≠0
H1: β3=0
H0-нулевая гипотеза, которая предполагает, что между Уровнем рождаемости и Плодовитостью женщин нет линейной зависимости
H1-альтернативная гипотеза, которая предполагает, что между ними есть линейная зависимость.
H0: β5≠0
H1: β5=0
H0-нулевая гипотеза, которая предполагает, что между Уровнем рождаемости и Ростом сельского населения нет линейной зависимости
H1-альтернативная гипотеза, которая предполагает, что между ними есть линейная зависимость.
df=(n-k)=(22-4)=18
Так как мы проводим 2-х хвостовой тест, мы находим ttab с уровнем доверия α/2= 0,05/2=0,025.
t(0,05/2)(18)= 2,10092
tstat вычисляется по следующей формуле:
Для вычисления tstat вычислим Sb (Стандартная ошибка коэффициента регрессии ) по формуле:
S1=0,03
S3=0,79
S5=0,14
Predictor
Constant
Детская смертность 0,51050 0,03914 13,04 2,1
Плодовитость женщин 3,8616 0,7928 4,87 1,5
Рост сельского населения 0,9869 0,1419 6,96 1,8
t(0,05/2)(18)<t
По данным видно, что для всех предикторов отвергается нулевая гипотеза. Из этого следует, что между Уровнем рождаемости и всеми предикторами – детская смертность, плодовитость женщин и рост сельского населении существует линейная зависимость, на всем исследуемом промежутке времени.
Проведя
t-тест, установлены наилучшие предикторы,
которые описывают изменения Уровня рождаемости.
Коэффициент детерминации показывает, на сколько зависит зависимая переменная от независимой.
В
данной задаче коэффициент детерминации
показывает насколько взятые предикторы,
объясняют изменение Уровня рождаемости.
Определим коэффициент детерминации по формуле:
или
Для данной задачи коэффициент детерминации составляет R2 = 97,6%, т.е. Уровень рождаемости на 97,6 % объясняется Детской смертностью, Плодовитостью женщин и Ростом сельского населения.
Стандартная ошибка оценивания - это величина изменчивости, наблюдаемых значений Y, вокруг линии регрессии:
S = 0,175230
Это значит, что значения Y (Уровень рождаемости) будут отклоняться от линии регрессии на 0,175.
Интерпретация коэффициентов уравнения.
Для того, чтобы понять в какой степени Детская смертность, Плодовитость женщин и Рост сельского населения влияют на изменение Уровень рождаемости.
Уравнение регрессии имело следующий вид:
Уровень рождаемости = 1,58 + 0,510 Детская смертность
Y=1,58+0,51X1+3,86Х3+0,
b0=1,58 b1=0,51 b3=3,86 b5=0,987
Данные коэффициенты интерпретируются следующим образом:
b0 показывает постоянный Уровень рождаемости, при отсутствии Детской смертности, Плодовитости женщин и Роста сельского населения. Из этого следует, что если все предикторы будут равняться нулю, то Уровень рождаемости будет составлять 1,58 ребенка на 1000 людей.
b1 показывает как изменится Уровень рождаемости, если Детская смертность увеличится на 1 ребенка. Следовательно, если Детская смертность увеличивается на 1 ребенка, то Уровень рождаемости увеличивается на 0,51 рожденного на 1000 человек.
b3 показывает как изменяется тот же Уровень рождаемости при измени Плодовитости женщин на 1го ребенка, т.е. если плодовитость женщин увеличится на 1 единицу, то уровень рождаемости увеличится на 3,86 ребенка.
b5
показывает изменчивость Уровня рождаемости,
при Росте населения на 1%. И это изменение
составляет 0,987.
Доверительные интервалы для коэффициентов уравнения регрессии с заданным коэффициентом доверия показывают, в каких промежутках лежат значении коэффициентов уравнения.
Доверительный интервал вычисляется по формуле:
2,08596
Sb0= 0,97 Sb1=0,03 Sb3=0,79 Sb5=0,14
b0=1,58
b1=0,51 b3=3,86
b5=0,987
Predictor
Constant 1,5836 0,9771 1,62
Mortality rate, infant (per 1,0 0,51050 0,03914 13,04
Fertility rate, total (births p 3,8616 0,7928 4,87
Rural population
growth (annual 0,9869 0,1419 6,96
Итак,
1,58-2,09*0,97<b0<1,58+2,
-0,45<b0<3,6
0,51-2,09*0,03<b5<0,51+2,
0,45<b1<0,57
3,86-2,09*0,79<b7<3,86+2,
2,2<b3<5,51
0,987-2,09*0,14<b5<0,987+
0,69<b3<1,28
Прогноз по уравнению для данного значения. Доверительные интервалы 2 видов с заданным уровнем доверия.
Прогнозируемый интервал используется, чтобы предсказать определенное значение y для данного значения х.
Где
Доверительный интервал используется для оценки среднего значения y для определенного значения x:
Где
Доверительным
и прогнозируемым интервалом для Уровня
рождаемости при уровне доверия 0,05, при
Х1=8, Х3=2 и Х5=1 является
(13,2814; 15,4739) (13,2213; 15,5341)
Следовательно,
с 95% уверенностью можно заявить, что среднее
значение Уровня рождаемости при заданном
значении Детской смертности=8, Плодовитости
женщин=2 и Роста сельского населения=1
является интервал от 13,2814 до 15,4739. Значение
же прогнозируемого Уровня доверия, при
тех же значениях предикторов будет лежать
в интервале от 13,2213 до 15,5341.
Коэффициент множественной детерминации r2 y.123
Коэффициент множественной детерминации показывает какую долю зависимой Y объясняют независимые переменные. В нашей задаче – это Х1, Х3 и Х5.
Значит, r2 y.135= 97,6%
Уровень
рождаемости на 97,6% описывается Детской
смертностью, Плодовитостью женщин и Ростом
сельского населения, а остальные 2,4% другими
факторами
Коэффициенты
частной детерминации
r2y5.7
и r2y.7.5
Коэффициенты
частичной детерминации показывают долю
зависимой переменной, которая описывается
одним предиктором, в то время как второй
предиктор является постоянной величиной.
Информация о работе Уровень рождаемости в Германие и факторы, влияющие на данный уровень