Автор работы: Пользователь скрыл имя, 06 Мая 2010 в 17:27, Не определен
Введение……………………………………………………………………………2
Глава 1. Организация и проведение статистического наблюдения
1.1 Разработка организационно-методологических вопросов……………………4
1.2 Формирование выборки……………………………………………………….7
1.2.1 Выбор метода и способа выборочного наблюдения, расчет объема выборки…………………………………………………………………………...7
1.3 Выводы по результатам статистического наблюдения………………….......9
Глава 2. Корреляционно-регрессионный анализ
2.1 Исследование парной корреляции…………………………………………..12
2.2 Уравнение (модель) множественной регрессии……………………………28
2.2.1 Формирование модели множественной регрессии…………………….28
2.2.2 Оценка адекватности модели множественной регрессии……………..29
2.2.3 Оценка влияния факторных признаков на результативный признак…32
Глава 3. Оценка взаимосвязи между качественными признаками……………...35
Глава 4. Общий вывод по результатам выполнения курсовой работы…………39
Список использованной литературы……………………………………………...40
Приложение
Чтобы использовать формулу для линейного коэффициента корреляции рассчитаем дисперсию по даным приведенным в таблице 9:
Данный коэффициент попадет в интервал - это говорит о том, что связь между признаками сильная, а положительный знак коэффициента говорит о том, что связь прямая. Для оценки значимости коэффициента корреляции r используют t-критерий Стьюдента, который применяется при t-распределении, отличном от нормального.
При линейной однофакторной связи t-критерий можно рассчитать по формуле:
где (n - 2) – число степеней свободы при заданном уровне значимости α и объеме выборки n.
Полученное значение tрасч сравнивают с табличным значением t-критерия (для α = 0,05 и 0,01)
Получаем:
tрасч > tтабл=2,77643 , линейный коэффициент считается значимым, а связь между x и y – существенной, т.е. мы можем исключить случайную ошибку и сказать, что коэффициент однозначно отражает связь между изучаемыми признаками.
Рассчитаем коэффициент детерминации, который показывает долю вариации результативного признака под влиянием вариации признака-фактора. В нашем случае , т.е. спрос на 76,73% зависит от частоты посещаемости предприятия.
С помощью мастер диаграмм строим графическую зависимость по данным таблицы 10, показывающую влияния стоимости заказа на спрос на предприятии общественного питания «Источник» (рис.4). Добавляем линию тренда и величину достоверности аппроксимации (показывает точность описания уравнения регрессии)-R2.
Таблица 10
Распределение значений стоимости заказа, сделанного на предприятии общественного питания «Источник» и спроса на предприятии среди населения в возрасте от 20 до 46лет
Возраст населения | Численность населения, n | Стоимость заказа на 1 чел, руб. x | Спрос на предприятии у |
20-24 | 7 | 2000 | 7 |
25-29 | 9 | 2500 | 10 |
30-34 | 9 | 3000 | 13 |
35-39 | 9 | 1000 | 7 |
40-44 | 12 | 1500 | 10 |
45-49 | 14 | 300 | 4 |
Рис. 4
В основе зависимости спроса от стоимости заказа лежит прямолинейная связь, которая может быть выражена простым линейным уравнением регрессии:
ŷ = a0 + a1x,
где ŷ -
теоретические расчётные
a0 , a1 - коэффициенты (параметры) уравнения регрессии;
х – частота посещений предприятий.
Параметры уравнения a0 , a1 находят методом наименьших квадратов (МНК - метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений), то есть в основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных yi от выровненных ŷ :
S(yi – ŷ)2 = S(yi – a0 – a1xi)2 ® min
Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:
Решим эту систему в общем виде:
;
Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:
, ,
- средние значения
Определим значения a0 , a1 по данным рассчитанным в таблице 11, подставим их в уравнение связи ŷ = a0 + a1x, и найдем значения ŷ, зависящие только от заданного значения х.
Получаем:
Таблица 11
Расчетные значения
Возраст населения | Численность населения | Стоимость заказа, руб. x | Спрос на предприятии, порции y | | |||
20-24 | 7 | 2000 | 7 | 283,34 | 80281,5556 | -1,5 | -425,01 |
25-29 | 9 | 2500 | 10 | 783,34 | 613621,5556 | 1,5 | 1175,01 |
30-34 | 9 | 3000 | 13 | 1283,34 | 1646961,556 | 4,5 | 5775,03 |
35-39 | 9 | 1000 | 7 | -716,66 | 513601,5556 | -1,5 | 1074,99 |
40-44 | 12 | 1500 | 10 | -216,66 | 46941,5556 | 1,5 | -324,99 |
45-49 | 14 | 300 | 4 | -1416,66 | 2006925,556 | -4,5 | 6374,97 |
итого | 60 | 10300 | 51 | 4908333,334 | 13650 |
Таким образом, регрессионная модель зависимости спроса от частоты посещений может быть записана в виде конкретного простого уравнения регрессии: .
Проверка адекватности модели может быть дополнена нахождением значения средней ошибки аппроксимации:
где y – значение результативного признака;
- теоретические значения
Таблица 12
Расчетные значения
Возраст населения | Численность населения, ni | Стоимость заказа на 1 чел, руб. x | Спрос на предприятии общественного питания уi | |||
20-24 | 7 | 2000 | 7 | 9,326 | -2,326 | -0,33228571 |
25-29 | 9 | 2500 | 10 | 10,726 | -0,726 | -0,0726 |
30-34 | 9 | 3000 | 13 | 12,126 | 0,874 | 0,067230769 |
35-39 | 9 | 1000 | 7 | 6,526 | 0,474 | 0,067714286 |
40-44 | 12 | 1500 | 10 | 7,926 | 2,074 | 0,2074 |
45-49 | 14 | 300 | 4 | 4,566 | -0,566 | -0,1415 |
итого | 60 | 10300 | 51 | -0,20404065 |
Подставив данные полученные в таблице 12 получаем:
Величина не превышать допустимого значения средней ошибки 12% - 15%, это значит, что данная модель адекватна, соответствует фактическим данным.
Определим значимость коэффициентов с помощью t-критерия Стьюдента по данным таблицы 13. При этом вычисляются расчетные значения t-критерия:
n-объем выборки
- среднеквадратическое
среднеквадратическое
Таблица 13
Расчетные значения
Возраст населения | Численность населения, ni | Стоимость заказа на 1 чел, руб. x | Спрос на предприятии общественного питания уi | |||
20-24 | 7 | 2000 | 7 | 9,326 | -2,326 | 5,410276 |
25-29 | 9 | 2500 | 10 | 10,726 | -0,726 | 0,527076 |
30-34 | 9 | 3000 | 13 | 12,126 | 0,874 | 0,763876 |
35-39 | 9 | 1000 | 7 | 6,526 | 0,474 | 0,224676 |
40-44 | 12 | 1500 | 10 | 7,926 | 2,074 | 4,301476 |
45-49 | 14 | 300 | 4 | 4,566 | -0,566 | 0,320356 |
итого | 60 | 10300 | 51 | 11,547736 |