Статистическое изучение связи между явлениями, область применения

Автор работы: Пользователь скрыл имя, 12 Февраля 2011 в 10:30, курсовая работа

Описание работы

Цель работы – на основе изучения и обобщения статистических методов корреляционного и регрессионного анализа исследовать различные зависимости.

Содержание работы

ВВЕДЕНИЕ…………………………………………………………………………..3
ГЛАВА 1. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ СВЯЗИ МЕЖДУ
ЯВЛЕНИЯМИ………………………………………………………………………..4
Виды и формы связей………………………………………………….4
Результативный и факторный признак……………………………….7
Методы изучения и применения взаимосвязей………………………8
Корреляционно-регрессионный анализ……………………………..11
Уравнение регрессии, показатели измерения тесноты связи………23
ГЛАВА 2. СТАТИСТИЧЕСКИЕ СВЯЗИ МЕЖДУ ЯВЛЕНИЯМИ НА ПРИМЕРЕ…………………………………………………………………………...28
2.1. Зависимость среднего балла учеников от класса обучения………...28
ЗАКЛЮЧЕНИЕ…………………………………………………………………......32
БИБЛИОГРАФИЧЕСКИЙ СПИСОК……………………………………………..34

Файлы: 1 файл

Статистическое изучение связи между явлениями область применения.doc

— 386.50 Кб (Скачать файл)

1.5  Уравнение  регрессии, показатели измерения  тесноты связи 

     Уравнение регрессии  всегда дополняется показателем  тесноты связи. При использовании  линейной регрессии в качестве такового показателя выступает линейный коэффициент  корреляции r. Одна из формул линейного коэффициента корреляции имеет вид: 

      
            

      
Коэффициент корреляции находится в пределах: . Если b>0,  то 0<r<1,  и, наоборот,  при b<0,   -1< r<0.19

     Линейный коэффициент  корреляции оценивает тесноту связи  рассматриваемых признаков в  ее линейной форме. Поэтому близость абсолютного значения линейного  коэффициента корреляции к нулю еще не означает отсутствие связи между признаками. При нелинейном виде  модели связь может оказаться достаточно тесной.

     Квадрат линейного  коэффициента корреляции называется коэффициентом  детерминации. Он характеризует долю дисперсии результативного показателя y, объясняемую регрессией.

     Соответственно величина 1-r характеризует долю дисперсии у, вызванную влиянием остальных, неучтенных в модели, факторов.

     После того как построено  уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных ее параметров.

     Оценка значимости уравнения регрессии в целом  производится с помощью F-критерия Фишера.

     С F-критерием  тесно связана характеристика, называемая  числом степеней свободы, которая применительно к исследуемой проблеме  показывает, сколько независимых отклонений из n-возможных  

     требуется для образования  данной суммы квадратов.

     Существует  равенство между числом степеней свободы общей, факторной   и остаточной суммы квадратов.

     Число степеней  свободы для факторной суммы квадратов равно 1, для общей суммы квадратов равно (n-1), для остаточной суммы квадратов составляет  (n-2).

      
            

      
Разделив каждую сумму квадратов  на соответствующее ей число степеней свободы, получаем дисперсию на одну степень свободы:

     
             

      
Сопоставляя факторную и остаточную дисперсию на одну степень свободы, получим величину  F- отношения  (F - критерий):

     Величина F- критерия связана с коэффициентом  детерминации r2 :

      
             

       
F -  критерий для проверки нулевой  гипотезы H0:  Dфакт = Dост.20

     Т.е. если нулевая гипотеза справедлива, то факторная и остаточная дисперсии  не отличаются друг от друга. Это  дает  основание  считать, что  влияние объясняющей  переменной  х  модели       несущественно, а,  следовательно,   общее   качество  модели  невысоко.

     Английским  статистиком Снедекором разработаны  таблицы критических значений  F – отношений при разных уровнях существенности нулевой гипотезы и  различном числе степеней свободы. Табличное значение  F – критерия – это максимальная величина отношения дисперсии, которая может иметь место при случайном  их расхождении для данного уровня вероятности наличия нулевой гипотезы.

     Если Fфакт > Fтабл, то нулевая гипотеза  об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи.

     Если   F факт < Fтабл, то H0 не отклоняется и уравнение регрессии считается статистически незначимым.

                           
              

     

        
 
 
 
 
      
                    
 

     В линейной регрессии обычно оценивается  значимость  не только  уравнения в целом, но и отдельных его параметров. Для этого по каждому из параметров определяется его стандартная ошибка: m и ma

     Для оценки  существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т. е. определяется фактическое значение t -  критерия Стьюдента:

        , которое затем сравнивается с табличным значением при заданном уровне значимости  a и числе степеней свободы (n-2)

     Имеет место равенство:

      .

     Для оценивания существенности параметра    определяется

         и его величина  сравнивается с табличным  значением.

     Если  табличное значение t – критерия превышает фактическое, то делается вывод о несущественности данного коэффициента, а если наоборот, табличное значение меньше фактического  - вывод о существенности данного коэффициента.

     Значимость  линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции:

     

     Фактическое значение t – критерия Стьюдента  определяется как  

     

     Т.о. проверка гипотез о значимости коэффициентов  регрессии и корреляции равносильна  проверке гипотезы о существенности линейного уравнения регрессии.21

     B прогнозных расчетах по уравнению  регрессии определяется предсказываемое  (ур) значение как точечный прогноз ух при хр = хк т.е. путем подстановки в уравнение регрессии соответствующего значения х. Точечный прогноз явно не реален, поэтому он всегда дополняется расчетом стандартной ошибки   , т.е. , и соответственно интервальной оценкой прогнозного значения:

                            

     Стандартная ошибка предсказываемого среднего значения у, при заданном значении х , определяется по формуле:

          

     где  .22

     При прогнозировании на основе уравнения  регрессии следует помнить, что  величина прогноза зависит не только от стандартной ошибки индивидуального  значения у, но и от точности прогноза значения фактора х.

     Доверительные интервалы прогноза индивидуальных значений у при фиксированных значениях х с различными вероятностями имеют вид:

      ;

     где       ta=1 при 68% вероятности  

       ta=2,0 при 95% вероятности    

       ta=2,58 при 99% вероятности

     Для экономических расчетов степень  вероятности обычно принимается равной 95%. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

     ГЛАВА  2. СТАТИСТИЧЕСКИЕ СВЯЗИ МЕЖДУ ЯВЛЕНИЯМИ  НА ПРИМЕРЕ 

2.1  Зависимость среднего балла учеников от класса обучения 

    В исследовании принимала участие  параллель 9 классов (46 человек) 2009-2010 учебного года МОУ “СОШ №11” г. Лесосибирска. 23

    На  первом этапе исследования была составлена предварительная статистическая совокупность: для каждого ученика 9 класса был  рассчитан средний годовой балл  на протяжении всех лет обучения.  Результаты отражены в таблице 1.

    На  втором этапе был рассчитан средний балл всех учеников за 1, 2…, 9 класс и получена корреляционная зависимость между факторным признаком (х) – класс обучения и результативным признаком (у) – средний балл обучения (успеваемость). Результаты представлены в таблице 2.

 

Таблица 1 – Расчетные данные

Ученик Средний балл обучения (с 1 по 9 класс)
1 2 3 5 6 7 8 9
1 Балдин Д. 4,57 3,625 4,25 3,636 4 3,467 3,313 3,2
2 Ботнарь К. 3,5 3,875 3,75 3,727 4 3,467 3,47 3
3 Белоусов Т. 3,875 3,875 4,125 4,091 4,077 3,733 3,438 3,067
4 Бортникова  М. 5 4,889 5 4,909 4,538 4,667 4,733 4,467
5 Васильева Т. 4,455 4,455 4,4 4,455 4,583 4,733 4,625 4,867
6 Герасимов М. 4,857 4,857 4,857 5 4,846 5 5 4,933
7 Гарманов А. 4 4,2 3,857 3,3 3,333 3,2 3,2 3
8 Дроботова Н. 4,571 4,5 4,375 4,182 4,077 3,733 3,875 3,067
9 Долгошеева  А. 4,429 4,429 4,429 4,5 4,077 4,133 4,176 4
10 Ефимов Д. 3,286 3,556 3,333 3,4 3,583 3,357 3,375 3
11 Зырянова Е. 4,857 4,625 4,5 4,727 4,615 4,786 4,733 4,4
12 Захарова М. 4,6 4,6 4,7 4,727 4,364 4,2 4,235 4,133
13 Иванов В. 4,429 4,5 4,25 4,091 4,077 3,333 3,176 3,333
14 Исаев Ю. 4 3,75 3,556 3,636 3,615 3,867 3,882 3,4
15 Капитонов С. 4,143 4,5 3,75 3,909 4 3,733 3,529 3,2
16 Моисеева К. 4,714 4,429 4,571 4,636 4,308 3,933 3,824 3,643
17 Матронина К. 4,857 4,875 5 5 5 5 5 4,867
18 Степуро Т. 5 5 5 5 5 5 5 4,933
19 Сундетов Н. 4 3,75 3,778 3,455 3,231 3,133 3,353 3
20 Ушакова В. 4,714 4,5 4,5 4,636 4,231 3,733 3,824 3,333
21 Филимонов И. 4,571 4,5 4,625 4,545 4,167 3,933 3,933 3,214
22 Хабибуллин  И. 4,286 4,125 3,875 3,818 3,462 3,333 3,313 3
23 Чемисов А. 4,57 4,429 4,143 4,273 4,231 4,2 4,294 4
24 Шевченко О. 4,75 4,5 4,625 4,364 4,231 4,267 4,25 4,133
25 Шароглазов  А. 4,714 4,75 4,75 5 5 5 5 5
26 Щербаков И. 4,571 3,75 3,625 3,364 3,231 3,2 3,313 3,067
27 Дитковская  А. 4,286 4,5 4,125 4,091 4,154 4,067 4,235 3,533
28 Меркулов А. 4,857 4,75 4,375 4,091 4,231 4,067 4,125 3,733
29 Бондаренко  Н. 4,143 3,625 3,625 3,727 3,308 3,267 3,294 3,133
30 Бондаренко  Ю. 4,571 4,375 4,5 4,364 4,417 4,286 4,412 4,067
31 Звягинцев А. 4,222 4,25 4,375 4,091 4 4,067 4,176 3,933
32 Кайсина Н. 4,333 4,5 4,125 4,273 3,846 3,929 3,688 3,071
33 Козлов А. 4,333 4,25 4 3,909 3,615 3,8 3,588 3,333
34 Капитан М. 3,857 4 3 3,583 3,385 3,133 3,117 2,667
35 Коробейников  С. 4 4,167 4,125 3,636 3,462 3,4 3,706 3,2
36 Каверзин А. 3,625 3,625 3,625 3,4 3,308 3,2 3,353 3,2
37 Лозовская Н. 3,833 4 3,714 3,818 3,692 3,867 4 3,667
38 Мухаметшин  Р. 4,667 4,625 4,625 3,909 4,154 3,867 3,823 3,467
39 Нехорошев Д. 3,5 3,375 3,5 3,455 3,308 3,067 3,353 3,133
40 Раченко А. 3,75 3,875 4 4 3,846 3,4 3,294 3
41 Тимук Д. 4 4 4,222 3,364 4,538 3,467 3,765 3,533
42 Филимонова  Т. 4,5 4,375 4,375 4,091 4 4,267 4,125 3,267
43 Черноусов Г. 5 4,875 4,375 3,923 3,769 4,071 4,294 4,133
44 Шарафутдинова Д. 4,286 4,375 4,125 4,091 4,083 3,692 3,867 3,2
45 Юсупов Р. 3,833 3,75 3,625 3,364 3,538 3,333 3,294 3
 

Таблица 2 – Средний балл учеников

x 1 2 3 4 5 6 7 8 9
y 4,317 4,256 4,170 - 4,064 3,999 3,863 3,888 3,581
 

Рисунок 2 - Зависимость среднего балла учеников от класса обучения

      На третьем этапе был рассчитан  показатель тесноты корреляционной  связи – линейный коэффициент  корреляции r = -0,958. Согласно которому связь между изучаемыми явлениями является обратной, сильной.

    На  следующем этапе было составлено уравнение регрессии для рассматриваемой  корреляционной зависимости. Согласно графической интерпретации результатов  исследования (рисунок 1) для математического  описания статистической зависимости  необходимо воспользоваться линейным уравнением регрессии: . Уравнение регрессионной модели для нашего случая примет вид: .24

    Далее была построена статистическая таблица, в которой указаны значения факторного признака х (класс обучения), эмпирические значения результативного признака y, теоретические значения результативного признака у. Кроме того, в таблицу были добавлены результаты успеваемости за 1 полугодие 10 класса и спрогнозирована успеваемость школьников на 10,11 классы обучения. 

      Таблица 3 – Практическое использование  построенной модели

х y (эмпирические) у (теоретические)
1 4,317 4,346
2 4,256 4,267
3 4,170 4,188
5 4,064 4,030
6 3,999 3,954
7 3,863 3,872
8 3,888 3,793
9 3,581 3,714
10 3,894 3,635
11   3,556

Информация о работе Статистическое изучение связи между явлениями, область применения