Уровень рождаемости в Германие и факторы, влияющие на данный уровень

Автор работы: Пользователь скрыл имя, 15 Января 2011 в 14:35, курсовая работа

Описание работы

Целью курсовой работы является:

•установить, влияют ли на самом деле на уровень рождаемости такие факторы как детская смертность, плодовитость женщин, рост сельского населения, население женщин и ожидаемый уровень жизни женщин.
•провести анализ зависимости между данными факторами и установить влияние на уровень рождаемости.
Предметом анализа являются года с 1989 по 2010 годы.

Содержание работы

Введение 2
Постановка задача 5
Анализ задачи 6
Заключение. 18
Список использованной литературы. 20

Файлы: 1 файл

Курсовая.doc

— 440.00 Кб (Скачать файл)

    Предикторы Х3 и  Х5 описывают Уровень рождаемости  на 74,9%.

  1. Модель со всеми предикторами:

    Уравнение регрессии:

    Уровень рождаемости = 0,3 - 0,017 Детская смертность

              - 0,413 Ожидаемая продолжительность жизни при рождении                                  + 5,15 Плодовитость женщин

                                + 0,69 Женское население

                                + 0,546 Рост сельского населения

    R-Sq = 98,3%

    Проанализировав все наилучшие модели, приходим к  выводу, что лучшей моделью является модель с тремя предикторами Х1 (детская смертность), Х3 (плодовитость женщин) и Х5 (рост сельского населении), зависимость данных предикторов с Уровнем рождаемости составляет 0,95179, 0,44751, 0,68268 соответственно. Коэффициент детерминации R2 равен 97,6%, это значит, что эти предикторы описывают Уровень рождаемости (Y) на 97,6 %.

    Хотя  модель со всеми предикторами имеет  самый высокий коэффициент детерминации, равный 98,3%, данная модель не может исследоваться  в качестве наилучшей, так как  между некоторыми предикторами существует высокая коллинеарность.

    Проводя дальнейшие исследования будет использована модель с тремя предикторами (Х1, Х3 и Х5). 

    Проверка  F теста с заданным уровнем доверия.

    F-тест  проверяет значимость уравнения регрессии в целом, существует ли зависимость между постоянной и переменными.

    Выдвигаем гипотезы:

    H0: ρ2=0

    H1: ρ2 >0

    При нулевой гипотезе подтверждается, что между переменными  и постоянной не существует зависимость.

    Если же подтверждается первая гипотеза, то устанавливается, что между постоянной и переменными существует зависимость.

    Для проверки теста  понадобятся значения Fstat и Ftab. 
 

    Fstat находим по следующей формуле:

    

    Source          DF       SS      MS       F      P

    Regression       3  22,4816  7,4939  244,05  0,000

    Residual Error  18   0,5527  0,0307

    Total           21  23,0343

     

    Найдем  Ftab с уровнем доверия α= 0,05

    Ftab= 3,15991 

    Сравнив значения Ftab и Fstat приходим в выводу, что Ftab< Fstat (3,15991<244,05), значит, отвергается нулевая гипотеза, и устанавливается, что выбранное уравнение регрессии в значительной степени описывает Уровень рождаемости на протяжении всех годов, которые были выбраны к качестве данных. 

    Тест  на коэффициент регрессии  проводится, чтобы установить все ли выбранные предикторы одинаково хорошо описывают модель во все периоды времени или всё же существуют некоторые отклонения.

    Выдвинем  следующие гипотезы:

    H0: β1≠0

    H1: β1=0

    H0-нулевая гипотеза, которая предполагает, что между Уровнем рождаемости и Детской смертностью нет линейной зависимости

    H1-альтернативная гипотеза, которая предполагает, что между ними есть линейная зависимость.

    H0: β3≠0

    H1: β3=0

    H0-нулевая гипотеза, которая предполагает, что между Уровнем рождаемости и Плодовитостью женщин нет линейной зависимости

    H1-альтернативная гипотеза, которая предполагает, что между ними есть линейная зависимость.

    H0: β5≠0

    H1: β5=0

    H0-нулевая гипотеза, которая предполагает, что между Уровнем рождаемости и Ростом сельского населения нет линейной зависимости

    H1-альтернативная гипотеза, которая предполагает, что между ними есть линейная зависимость.

    df=(n-k)=(22-4)=18

    Так как мы проводим 2-х хвостовой  тест, мы находим ttab с уровнем доверия α/2= 0,05/2=0,025.

    t(0,05/2)(18)= 2,10092

    tstat вычисляется по следующей формуле:

    

    Для вычисления tstat вычислим Sb (Стандартная ошибка коэффициента регрессии ) по формуле:

    

 

    S1=0,03

    S3=0,79

    S5=0,14 
 

    Predictor                           Coef  SE Coef      T      VIF

    Constant                          1,5836   0,9771  1,62 

    Детская смертность                0,51050  0,03914  13,04    2,1

    Плодовитость  женщин               3,8616   0,7928   4,87     1,5

    Рост  сельского населения          0,9869   0,1419   6,96      1,8

    t(0,05/2)(18)<t

    По  данным видно, что для всех предикторов отвергается нулевая гипотеза. Из этого следует, что между Уровнем рождаемости и всеми предикторами – детская смертность, плодовитость женщин и рост сельского населении существует линейная зависимость, на всем исследуемом промежутке времени.

    Проведя t-тест, установлены наилучшие предикторы, которые описывают изменения Уровня рождаемости. 

    Коэффициент детерминации показывает, на сколько зависит зависимая переменная от независимой.

    В данной задаче коэффициент детерминации показывает насколько взятые предикторы, объясняют изменение Уровня рождаемости. 

    Определим коэффициент детерминации по формуле:

      или 

    Для данной задачи коэффициент детерминации составляет R2 = 97,6%, т.е. Уровень рождаемости на 97,6 % объясняется Детской смертностью, Плодовитостью женщин и Ростом сельского населения.

    Стандартная ошибка оценивания - это величина изменчивости, наблюдаемых значений Y, вокруг линии регрессии:

    

    S = 0,175230

    Это значит, что значения Y (Уровень рождаемости) будут отклоняться от линии регрессии на 0,175.

    Интерпретация коэффициентов уравнения.

    Для того, чтобы понять в какой степени  Детская смертность, Плодовитость женщин и Рост сельского населения влияют на изменение Уровень рождаемости.

    Уравнение регрессии имело следующий вид:

    Уровень рождаемости = 1,58 + 0,510 Детская смертность

                                      + 3,86 Плодовитость женщин

                                      + 0,987 Рост сельского населения

    Y=1,58+0,51X1+3,86Х3+0,987X5

    b0=1,58    b1=0,51    b3=3,86   b5=0,987

    Данные  коэффициенты интерпретируются следующим образом:

    b0 показывает постоянный Уровень рождаемости, при отсутствии Детской смертности, Плодовитости женщин и Роста сельского населения. Из этого следует, что если все предикторы будут равняться нулю, то Уровень рождаемости будет составлять 1,58 ребенка на 1000 людей.

    b1 показывает как изменится Уровень рождаемости, если Детская смертность увеличится на 1 ребенка. Следовательно, если Детская смертность увеличивается на 1 ребенка, то Уровень рождаемости увеличивается на 0,51 рожденного на 1000 человек.

    b3 показывает как изменяется тот же Уровень рождаемости при измени Плодовитости женщин на 1го ребенка, т.е. если плодовитость женщин увеличится на 1 единицу, то уровень рождаемости увеличится на 3,86 ребенка.

    b5 показывает изменчивость Уровня рождаемости, при Росте населения на 1%. И это изменение составляет 0,987. 

    Доверительные интервалы для  коэффициентов уравнения  регрессии с заданным коэффициентом доверия показывают, в каких промежутках лежат значении коэффициентов уравнения.

    Доверительный интервал вычисляется по формуле:

    

     2,08596

    Sb0= 0,97     Sb1=0,03     Sb3=0,79      Sb5=0,14

    b0=1,58    b1=0,51    b3=3,86   b5=0,987 

    Predictor                           Coef  SE Coef      T     

    Constant                          1,5836   0,9771   1,62 

    Mortality rate, infant (per 1,0  0,51050  0,03914  13,04 

    Fertility rate, total (births p   3,8616   0,7928   4,87 

    Rural population growth (annual   0,9869   0,1419   6,96   

    Итак,

    1,58-2,09*0,97<b0<1,58+2,09*0,97

    -0,45<b0<3,6

    0,51-2,09*0,03<b5<0,51+2,09*0,03

    0,45<b1<0,57

    3,86-2,09*0,79<b7<3,86+2,09*0,79

    2,2<b3<5,51

    0,987-2,09*0,14<b5<0,987+2,09*0,14

    0,69<b3<1,28

    Прогноз по уравнению для  данного значения. Доверительные интервалы 2 видов с заданным уровнем доверия.

    Прогнозируемый интервал используется, чтобы предсказать определенное значение y для данного значения х.

    

    Где

    Доверительный интервал используется для оценки среднего значения y для определенного значения x:

    

    Где

    Доверительным и прогнозируемым интервалом для Уровня рождаемости при уровне доверия 0,05, при Х1=8, Х3=2 и Х5=1 является        

                                                       95% CI              95% PI

                   (13,2814; 15,4739)  (13,2213; 15,5341) 

    Следовательно, с 95% уверенностью можно заявить, что среднее значение Уровня рождаемости при заданном значении Детской смертности=8, Плодовитости женщин=2 и Роста сельского населения=1 является интервал от 13,2814 до 15,4739. Значение же прогнозируемого Уровня доверия, при тех же значениях предикторов будет лежать в интервале от 13,2213 до 15,5341.  

    Коэффициент множественной детерминации r2 y.123

    Коэффициент множественной детерминации показывает какую долю зависимой Y объясняют  независимые переменные. В нашей задаче – это Х1, Х3 и Х5.

    Значит, r2 y.135= 97,6%

    Уровень рождаемости на 97,6% описывается Детской смертностью, Плодовитостью женщин и Ростом сельского населения, а остальные 2,4% другими факторами 

    Коэффициенты  частной детерминации r2y5.7 и r2y.7.5 

    Коэффициенты частичной детерминации показывают долю зависимой переменной, которая описывается одним предиктором, в то время как второй предиктор является постоянной величиной. 

Информация о работе Уровень рождаемости в Германие и факторы, влияющие на данный уровень