Автор работы: Пользователь скрыл имя, 12 Февраля 2011 в 10:30, курсовая работа
Цель работы – на основе изучения и обобщения статистических методов корреляционного и регрессионного анализа исследовать различные зависимости.
ВВЕДЕНИЕ…………………………………………………………………………..3
ГЛАВА 1. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ СВЯЗИ МЕЖДУ
ЯВЛЕНИЯМИ………………………………………………………………………..4
Виды и формы связей………………………………………………….4
Результативный и факторный признак……………………………….7
Методы изучения и применения взаимосвязей………………………8
Корреляционно-регрессионный анализ……………………………..11
Уравнение регрессии, показатели измерения тесноты связи………23
ГЛАВА 2. СТАТИСТИЧЕСКИЕ СВЯЗИ МЕЖДУ ЯВЛЕНИЯМИ НА ПРИМЕРЕ…………………………………………………………………………...28
2.1. Зависимость среднего балла учеников от класса обучения………...28
ЗАКЛЮЧЕНИЕ…………………………………………………………………......32
БИБЛИОГРАФИЧЕСКИЙ СПИСОК……………………………………………..34
1.5 Уравнение
регрессии, показатели
Уравнение регрессии
всегда дополняется показателем
тесноты связи. При использовании
линейной регрессии в качестве такового
показателя выступает линейный коэффициент
корреляции r. Одна из формул линейного
коэффициента корреляции имеет вид:
Коэффициент корреляции находится в пределах:
. Если b>0, то 0<r<1, и, наоборот,
при b<0, -1< r<0.19
Линейный коэффициент корреляции оценивает тесноту связи рассматриваемых признаков в ее линейной форме. Поэтому близость абсолютного значения линейного коэффициента корреляции к нулю еще не означает отсутствие связи между признаками. При нелинейном виде модели связь может оказаться достаточно тесной.
Квадрат линейного коэффициента корреляции называется коэффициентом детерминации. Он характеризует долю дисперсии результативного показателя y, объясняемую регрессией.
Соответственно величина 1-r2 характеризует долю дисперсии у, вызванную влиянием остальных, неучтенных в модели, факторов.
После того как построено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных ее параметров.
Оценка значимости уравнения регрессии в целом производится с помощью F-критерия Фишера.
С F-критерием тесно связана характеристика, называемая числом степеней свободы, которая применительно к исследуемой проблеме показывает, сколько независимых отклонений из n-возможных
требуется для образования данной суммы квадратов.
Существует равенство между числом степеней свободы общей, факторной и остаточной суммы квадратов.
Число степеней свободы для факторной суммы квадратов равно 1, для общей суммы квадратов равно (n-1), для остаточной суммы квадратов составляет (n-2).
Разделив каждую сумму квадратов
на соответствующее ей число степеней
свободы, получаем дисперсию на одну
степень свободы:
Сопоставляя факторную и остаточную
дисперсию на одну степень свободы,
получим величину F- отношения (F - критерий):
Величина F- критерия связана с коэффициентом детерминации r2 :
F - критерий для проверки нулевой гипотезы
H0: Dфакт = Dост.20
Т.е. если нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Это дает основание считать, что влияние объясняющей переменной х модели несущественно, а, следовательно, общее качество модели невысоко.
Английским статистиком Снедекором разработаны таблицы критических значений F – отношений при разных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Табличное значение F – критерия – это максимальная величина отношения дисперсии, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы.
Если Fфакт > Fтабл, то нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи.
Если F факт < Fтабл, то H0 не отклоняется и уравнение регрессии считается статистически незначимым.
|
| ||
В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров. Для этого по каждому из параметров определяется его стандартная ошибка: mb и ma:
Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т. е. определяется фактическое значение t - критерия Стьюдента:
, которое затем сравнивается с табличным значением при заданном уровне значимости a и числе степеней свободы (n-2)
Имеет место равенство:
.
Для оценивания существенности параметра определяется
и его величина сравнивается с табличным значением.
Если табличное значение t – критерия превышает фактическое, то делается вывод о несущественности данного коэффициента, а если наоборот, табличное значение меньше фактического - вывод о существенности данного коэффициента.
Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции:
Фактическое
значение t – критерия Стьюдента определяется
как
Т.о. проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.21
B
прогнозных расчетах по
Стандартная ошибка предсказываемого среднего значения у, при заданном значении х , определяется по формуле:
где .22
При прогнозировании на основе уравнения регрессии следует помнить, что величина прогноза зависит не только от стандартной ошибки индивидуального значения у, но и от точности прогноза значения фактора х.
Доверительные интервалы прогноза индивидуальных значений у при фиксированных значениях х с различными вероятностями имеют вид:
;
где ta=1 при 68% вероятности
ta=2,0 при 95% вероятности
ta=2,58 при 99% вероятности
Для
экономических расчетов степень
вероятности обычно принимается равной 95%.
ГЛАВА
2. СТАТИСТИЧЕСКИЕ СВЯЗИ МЕЖДУ ЯВЛЕНИЯМИ
НА ПРИМЕРЕ
2.1 Зависимость
среднего балла учеников от класса обучения
В исследовании принимала участие параллель 9 классов (46 человек) 2009-2010 учебного года МОУ “СОШ №11” г. Лесосибирска. 23
На
первом этапе исследования была составлена
предварительная статистическая совокупность:
для каждого ученика 9 класса был
рассчитан средний годовой
На втором этапе был рассчитан средний балл всех учеников за 1, 2…, 9 класс и получена корреляционная зависимость между факторным признаком (х) – класс обучения и результативным признаком (у) – средний балл обучения (успеваемость). Результаты представлены в таблице 2.
Таблица 1 – Расчетные данные
№ | Ученик | Средний балл обучения (с 1 по 9 класс) | |||||||
1 | 2 | 3 | 5 | 6 | 7 | 8 | 9 | ||
1 | Балдин Д. | 4,57 | 3,625 | 4,25 | 3,636 | 4 | 3,467 | 3,313 | 3,2 |
2 | Ботнарь К. | 3,5 | 3,875 | 3,75 | 3,727 | 4 | 3,467 | 3,47 | 3 |
3 | Белоусов Т. | 3,875 | 3,875 | 4,125 | 4,091 | 4,077 | 3,733 | 3,438 | 3,067 |
4 | Бортникова М. | 5 | 4,889 | 5 | 4,909 | 4,538 | 4,667 | 4,733 | 4,467 |
5 | Васильева Т. | 4,455 | 4,455 | 4,4 | 4,455 | 4,583 | 4,733 | 4,625 | 4,867 |
6 | Герасимов М. | 4,857 | 4,857 | 4,857 | 5 | 4,846 | 5 | 5 | 4,933 |
7 | Гарманов А. | 4 | 4,2 | 3,857 | 3,3 | 3,333 | 3,2 | 3,2 | 3 |
8 | Дроботова Н. | 4,571 | 4,5 | 4,375 | 4,182 | 4,077 | 3,733 | 3,875 | 3,067 |
9 | Долгошеева А. | 4,429 | 4,429 | 4,429 | 4,5 | 4,077 | 4,133 | 4,176 | 4 |
10 | Ефимов Д. | 3,286 | 3,556 | 3,333 | 3,4 | 3,583 | 3,357 | 3,375 | 3 |
11 | Зырянова Е. | 4,857 | 4,625 | 4,5 | 4,727 | 4,615 | 4,786 | 4,733 | 4,4 |
12 | Захарова М. | 4,6 | 4,6 | 4,7 | 4,727 | 4,364 | 4,2 | 4,235 | 4,133 |
13 | Иванов В. | 4,429 | 4,5 | 4,25 | 4,091 | 4,077 | 3,333 | 3,176 | 3,333 |
14 | Исаев Ю. | 4 | 3,75 | 3,556 | 3,636 | 3,615 | 3,867 | 3,882 | 3,4 |
15 | Капитонов С. | 4,143 | 4,5 | 3,75 | 3,909 | 4 | 3,733 | 3,529 | 3,2 |
16 | Моисеева К. | 4,714 | 4,429 | 4,571 | 4,636 | 4,308 | 3,933 | 3,824 | 3,643 |
17 | Матронина К. | 4,857 | 4,875 | 5 | 5 | 5 | 5 | 5 | 4,867 |
18 | Степуро Т. | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 4,933 |
19 | Сундетов Н. | 4 | 3,75 | 3,778 | 3,455 | 3,231 | 3,133 | 3,353 | 3 |
20 | Ушакова В. | 4,714 | 4,5 | 4,5 | 4,636 | 4,231 | 3,733 | 3,824 | 3,333 |
21 | Филимонов И. | 4,571 | 4,5 | 4,625 | 4,545 | 4,167 | 3,933 | 3,933 | 3,214 |
22 | Хабибуллин И. | 4,286 | 4,125 | 3,875 | 3,818 | 3,462 | 3,333 | 3,313 | 3 |
23 | Чемисов А. | 4,57 | 4,429 | 4,143 | 4,273 | 4,231 | 4,2 | 4,294 | 4 |
24 | Шевченко О. | 4,75 | 4,5 | 4,625 | 4,364 | 4,231 | 4,267 | 4,25 | 4,133 |
25 | Шароглазов А. | 4,714 | 4,75 | 4,75 | 5 | 5 | 5 | 5 | 5 |
26 | Щербаков И. | 4,571 | 3,75 | 3,625 | 3,364 | 3,231 | 3,2 | 3,313 | 3,067 |
27 | Дитковская А. | 4,286 | 4,5 | 4,125 | 4,091 | 4,154 | 4,067 | 4,235 | 3,533 |
28 | Меркулов А. | 4,857 | 4,75 | 4,375 | 4,091 | 4,231 | 4,067 | 4,125 | 3,733 |
29 | Бондаренко Н. | 4,143 | 3,625 | 3,625 | 3,727 | 3,308 | 3,267 | 3,294 | 3,133 |
30 | Бондаренко Ю. | 4,571 | 4,375 | 4,5 | 4,364 | 4,417 | 4,286 | 4,412 | 4,067 |
31 | Звягинцев А. | 4,222 | 4,25 | 4,375 | 4,091 | 4 | 4,067 | 4,176 | 3,933 |
32 | Кайсина Н. | 4,333 | 4,5 | 4,125 | 4,273 | 3,846 | 3,929 | 3,688 | 3,071 |
33 | Козлов А. | 4,333 | 4,25 | 4 | 3,909 | 3,615 | 3,8 | 3,588 | 3,333 |
34 | Капитан М. | 3,857 | 4 | 3 | 3,583 | 3,385 | 3,133 | 3,117 | 2,667 |
35 | Коробейников С. | 4 | 4,167 | 4,125 | 3,636 | 3,462 | 3,4 | 3,706 | 3,2 |
36 | Каверзин А. | 3,625 | 3,625 | 3,625 | 3,4 | 3,308 | 3,2 | 3,353 | 3,2 |
37 | Лозовская Н. | 3,833 | 4 | 3,714 | 3,818 | 3,692 | 3,867 | 4 | 3,667 |
38 | Мухаметшин Р. | 4,667 | 4,625 | 4,625 | 3,909 | 4,154 | 3,867 | 3,823 | 3,467 |
39 | Нехорошев Д. | 3,5 | 3,375 | 3,5 | 3,455 | 3,308 | 3,067 | 3,353 | 3,133 |
40 | Раченко А. | 3,75 | 3,875 | 4 | 4 | 3,846 | 3,4 | 3,294 | 3 |
41 | Тимук Д. | 4 | 4 | 4,222 | 3,364 | 4,538 | 3,467 | 3,765 | 3,533 |
42 | Филимонова Т. | 4,5 | 4,375 | 4,375 | 4,091 | 4 | 4,267 | 4,125 | 3,267 |
43 | Черноусов Г. | 5 | 4,875 | 4,375 | 3,923 | 3,769 | 4,071 | 4,294 | 4,133 |
44 | Шарафутдинова Д. | 4,286 | 4,375 | 4,125 | 4,091 | 4,083 | 3,692 | 3,867 | 3,2 |
45 | Юсупов Р. | 3,833 | 3,75 | 3,625 | 3,364 | 3,538 | 3,333 | 3,294 | 3 |
Таблица 2 – Средний балл учеников
x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
y | 4,317 | 4,256 | 4,170 | - | 4,064 | 3,999 | 3,863 | 3,888 | 3,581 |
Рисунок 2 - Зависимость среднего балла учеников от класса обучения
На третьем этапе был
На
следующем этапе было составлено
уравнение регрессии для
Далее
была построена статистическая таблица,
в которой указаны значения факторного
признака х (класс обучения), эмпирические
значения результативного признака
y, теоретические значения результативного
признака у. Кроме того, в таблицу были
добавлены результаты успеваемости за
1 полугодие 10 класса и спрогнозирована
успеваемость школьников на 10,11 классы
обучения.
Таблица 3 – Практическое использование построенной модели
х | y (эмпирические) | у (теоретические)
|
1 | 4,317 | 4,346 |
2 | 4,256 | 4,267 |
3 | 4,170 | 4,188 |
5 | 4,064 | 4,030 |
6 | 3,999 | 3,954 |
7 | 3,863 | 3,872 |
8 | 3,888 | 3,793 |
9 | 3,581 | 3,714 |
10 | 3,894 | 3,635 |
11 | 3,556 |
Информация о работе Статистическое изучение связи между явлениями, область применения