Автор работы: Пользователь скрыл имя, 06 Мая 2010 в 17:27, Не определен
Введение……………………………………………………………………………2
Глава 1. Организация и проведение статистического наблюдения
1.1 Разработка организационно-методологических вопросов……………………4
1.2 Формирование выборки……………………………………………………….7
1.2.1 Выбор метода и способа выборочного наблюдения, расчет объема выборки…………………………………………………………………………...7
1.3 Выводы по результатам статистического наблюдения………………….......9
Глава 2. Корреляционно-регрессионный анализ
2.1 Исследование парной корреляции…………………………………………..12
2.2 Уравнение (модель) множественной регрессии……………………………28
2.2.1 Формирование модели множественной регрессии…………………….28
2.2.2 Оценка адекватности модели множественной регрессии……………..29
2.2.3 Оценка влияния факторных признаков на результативный признак…32
Глава 3. Оценка взаимосвязи между качественными признаками……………...35
Глава 4. Общий вывод по результатам выполнения курсовой работы…………39
Список использованной литературы……………………………………………...40
Приложение
- объем выборки из i группы
- общий объем выборки
- объем i группы
- объем генеральной совокупности
человек необходимо опросить из возрастной группы от 20 до 24
человек необходимо опросить из возрастной группы от 25 до 29
человек необходимо опросить из возрастной группы от 30 до 34
человек необходимо опросить из возрастной группы от 35 до 39
человек необходимо опросить из возрастной группы от 40 до 44
человек необходимо опросить из возрастной группы от 45 до 49
Опрос проводился среди жителей г. Радужный в количестве 60 человек (приложение 1). В ходе наблюдения ошибки не выявлены. По окончанию опроса были получены данные, которые были занесены в таблицу 3.
Таблица 3.
Итоговая
таблица результатов
№ вопроса | Формулировка вопроса | Вариант ответа | Количество ответов | % доля |
1 | Как часто вы
посещаете предприятие |
а
б в |
14
28 18 |
23,33
46,66 30 |
2 | Вы предпочитаете посещать предприятие общественного питания, расположенное… | а
б в |
21
21 18 |
35
35 30 |
3 | Вы посещаете предприятие общественного питания для того чтобы … | а
б в |
21
25 14 |
35
41,66 23,33 |
4 | На какую стоимость заказа на 1 человека Вы рассчитываете, когда идете в предприятие общественного питания? | 300 руб.
1000 руб. 1500 руб. 2000 руб. 2500 руб. 3000 руб. |
14
9 12 7 9 9 |
23,33
15 20 11,66 15 15 |
5 | Сколько порций
Вы заказываете, когда приходите
на предприятие общественного |
а
б в г |
14
16 21 9 |
23,33
26,66 35 15 |
6 | считаете ли
Вы ассортимент предоставляемой
продукции предприятий |
а
б |
34
26 |
56,66
43,33 |
7 | Какие предприятий общественного питания Вы предпочитаете в основном посещать? | а
б |
35
25 |
58,33
41,66 |
8 | Удовлетворяет ли Вас качество предоставляемой предприятием общественного питания «Источник» продукции? | а
б в |
42
0 18 |
70
0 30 |
9 | сколько раз
Вы замечали при посещении предприятий
общественного питания « |
а
б в |
37
23 0 |
61,66
38,33 0 |
10 | Вы предпочитаете в основном посещать предприятий общественного питания, которые предоставляют дополнительные услуги (бильярд, караоке)? | а
б в |
30
18 12 |
50
30 20 |
11 | Сколько раз Вы сталкивались с нарушением прав потребителей на предприятии общественного питания «Источник»? | а
б в |
16
18 26 |
26,66
30 43,33 |
По данным представленным в таблице 3 видно, что:
Глава 2. Корреляционно-регрессионный анализ
В этой
главе проводится исследование парной
корреляции, формирование модели парной
регрессии и множественной
2.1 Исследование парной корреляции
Для изучения влияния частоты посещений на спрос на предприятии общественного питания «Источник» построим график-поле корреляции, чтобы проверить как проявляется связь между признаками.
Рис 1.
Из ходя из графика на рисунке 1 можно сделать вывод, что связь между признаками существует и имеется линейная зависимость, т.к. большинство точек попали в область ++
Оценим степень тесноты связи с помощью линейного коэффициента корреляции на основе данных таблицы 4:
- среднее значение
- среднее значение
- среднее квадратическое
- среднее квадратическое
n – число наблюдений.
Значение линейного коэффициента корреляции важно для исследования социально-экономических явлений и процессов, распределение которых близко к нормальному. Он принимает значения в интервале: -1≤ r ≤ 1.
Таблица 4
Расчетные значения
Возраст населения | Численность населения | Частота посещений предприятий, кол-во раз в мес. x | x2 | Спрос на предприятии, порции y | y2 | |||
20-24 | 7 | 4 | 16 | 7 | 49 | -0,83 | -1,5 | 0,45 |
25-29 | 9 | 8 | 64 | 10 | 100 | 3,17 | 1,5 | 5,55 |
30-34 | 9 | 8 | 64 | 13 | 169 | 3,17 | 4,5 | 16,65 |
35-39 | 9 | 4 | 16 | 7 | 49 | -0,83 | -1,5 | 0,45 |
40-44 | 12 | 4 | 16 | 10 | 100 | -0,83 | 1,5 | -0,45 |
45-49 | 14 | 1 | 1 | 4 | 16 | -3,83 | -4,5 | 14,85 |
итого | 60 | 29 | 177 | 51 | 483 | 37,5 |
Чтобы использовать формулу для линейного коэффициента корреляции рассчитаем дисперсию:
Данный коэффициент попадает в интервал - это говорит о том, что связь между признаками сильная, а положительный знак коэффициента говорит о том, что связь прямая.
Для оценки значимости коэффициента корреляции r используют t-критерий Стьюдента, который применяется при t-распределении, отличном от нормального.
При линейной однофакторной связи t-критерий можно рассчитать по формуле:
где (n - 2) – число степеней свободы при заданном уровне значимости α и объеме выборки n.
Полученное значение tрасч сравнивают с табличным значением t-критерия (для α = 0,05 и 0,01)
Подставляем данные в формулу:
Получаем, что tрасч > tтабл=2,77641 , линейный коэффициент считается значимым, а связь между x и y – существенной, т.е. мы можем исключить случайную ошибку и сказать, что коэффициент однозначно отражает связь между изучаемыми признаками.
Рассчитаем коэффициент детерминации, который показывает долю вариации результативного признака под влиянием вари признака-фактора. В нашем случае , т.е. спрос на 76% зависит от частоты посещаемости предприятия.
С
помощью мастер диаграмм строим графическую
зависимость по данным таблицы 5, показывающую
влияния частоты посещений на спрос на
предприятии общественного питания «Источник»
(рис.2). Добавляем линию тренда и величину
достоверности аппроксимации (показывает
точность описания уравнения регрессии)-R2.
Таблица 5
Распределение значений частоты посещений предприятий общественного питания и спроса на предприятии среди населения в возрасте от 20 до 46лет
Возраст населения | Численность населения, n | Частота посещения предприятия х | Спрос на предприятии у |
20-24 | 7 | 4 | 7 |
25-29 | 9 | 8 | 10 |
30-34 | 9 | 8 | 13 |
35-39 | 9 | 4 | 7 |
40-44 | 12 | 4 | 10 |
45-49 | 14 | 1 | 4 |
Рис 2
В основе зависимости спроса от частоты посещений предприятия лежит прямолинейная связь, которая может быть выражена простым линейным уравнением регрессии:
ŷ = a0 + a1x,
где ŷ -
теоретические расчётные
a0 , a1 - коэффициенты (параметры) уравнения регрессии;
х – частота посещений предприятий.
Параметры уравнения a0 , a1 находят методом наименьших квадратов (МНК - метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений), то есть в основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных yi от выровненных ŷ :
S(yi – ŷ)2 = S(yi – a0 – a1xi)2 ® min
Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:
Решим эту систему в общем виде:
;
Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:
, ,
- средние значения
Определим значения a0 , a1 данным рассчитанным в таблице 6, подставим их в уравнение связи ŷ = a0 + a1x, и найдем значения ŷ, зависящие только от заданного значения х.
Получаем:
Таблица 6
Расчетные значения