Автор работы: Пользователь скрыл имя, 30 Апреля 2013 в 06:34, контрольная работа
1. а) Определить границы, в которых с надежностью 0,9335 заключен средний месячный доход жителей города
б) каким должен быть объем выборки, чтобы те же границы гарантировать с надежностью 0,9855 ?
2. Определить границы, в которых с надежностью 0,9783 заключена доля наиболее обеспеченного населения города (12 и более минимальных заработных плат) и доля наименее обеспеченного населения города (менее 2 минимальных заработных плат).
3. Каким должен быть объем выборки , чтобы те же границы для доли наименее обеспеченного населения города гарантировать с надежностью 0,9873 ?
4. Как изменились бы результаты, полученные в п.3, если бы о доле наиболее обеспеченного населения региона вообще не было ничего известно?
Задача 1.4
Для оценки уровня жизни
жителей города проведен 1%-й опрос,
по схеме собственно-случайной
Количество минимальных заработных плат хi |
Менее 2 |
2-4 |
4-6 |
6-8 |
8-10 |
10-12 |
Более 12 |
Число жителей ni |
155 |
657 |
870 |
390 |
83 |
75 |
5 |
1. а) Определить границы,
в которых с надежностью 0,9335
заключен средний месячный
б) каким должен быть объем выборки, чтобы те же границы гарантировать с надежностью 0,9855 ?
2. Определить границы,
в которых с надежностью 0,9783
заключена доля наиболее
3. Каким должен быть объем выборки , чтобы те же границы для доли наименее обеспеченного населения города гарантировать с надежностью 0,9873 ?
4. Как изменились бы
результаты, полученные в п.3, если
бы о доле наиболее
Решение:
Проведем следующие расчеты:
Группы |
xi |
Кол-во, fi |
xi * fi |
Накопленная частота, S |
(x - xср) * f |
(x - xср)2 * f |
Частота, fi/n |
до 2 |
1.5 |
155 |
232.5 |
155 |
524.85 |
1777.21 |
0.0694 |
2 - 4 |
3 |
657 |
1971 |
812 |
1239.19 |
2337.27 |
0.29 |
4 - 6 |
5 |
870 |
4350 |
1682 |
99.07 |
11.28 |
0.39 |
6 - 8 |
7 |
390 |
2730 |
2072 |
824.41 |
1742.69 |
0.17 |
8 - 10 |
9 |
83 |
747 |
2155 |
341.45 |
1404.69 |
0.0371 |
10 - 12 |
11 |
75 |
825 |
2230 |
458.54 |
2803.46 |
0.0336 |
Более 12 |
13 |
5 |
65 |
2235 |
40.57 |
329.17 |
0.00224 |
|
|
2235 |
10920.5 |
|
3528.07 |
10405.77 |
1 |
Для оценки ряда распределения найдем следующие показатели:
Средняя взвешенная
Вычислим выборочную дисперсию:
xц |
x*i |
x*ifi |
[x*i]2fi |
1.5 |
-1.75 |
-271.25 |
474.69 |
3 |
-1 |
-657 |
657 |
5 |
0 |
0 |
0 |
7 |
1 |
390 |
390 |
9 |
2 |
166 |
332 |
11 |
3 |
225 |
675 |
13 |
4 |
20 |
80 |
|
|
-127.25 |
2608.69 |
Среднее квадратическое отклонение (средняя ошибка выборки).
Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
Каждое значение ряда отличается от другого не более, чем на 1.58
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Несмещенная оценка дисперсии - состоятельная оценка дисперсии.
Среднее квадратическое отклонение (средняя ошибка выборки).
Каждое значение ряда отличается от среднего значения 4.89 не более, чем на 2.16
Оценка среднеквадратического отклонения.
Определить границы, в которых с надежностью 0,9335 заключен средний месячный доход жителей города
или
где d - процент выборки.
Определяем значение tkp по таблицам функции Лапласа.
В этом случае 2Ф(tkp) = 1 - γ
Ф(tkp) = (1 - γ)/2 = 0.9335/2 = 0.4668
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.4668
tkp(γ) = (0.4668) = 1.84
(4.89 - 0.0836;4.89 + 0.0836) = (4.8;4.97)
С вероятностью 0.9335 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
или
где d - процент выборки.
Поскольку n ≤ 30, то определяем значение tkp по таблице распределения Стьюдента
По таблице Стьюдента находим:
Tтабл (n-1;α/2) = (7;0) = 6
(1 - 0;1 + 0) = (1;1)
С вероятностью 0 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Найдем доверительный интервал для среднеквадратического отклонения с надежностью γ = 0.9783.
Нижняя ошибка среднеквадратического отклонения:
Верхняя ошибка среднеквадратического отклонения:
(2.16 - 6.57; 2.16 + 6.57)
(-4.41; 8.73)
Найдем верхнюю границу
доверительного интервала для
0 ≤ σ ≤ 6.57
Доверительный интервал для генеральной доли.
Определяем значение tkp по таблицам функции Лапласа.
В этом случае 2Ф(tkp) = 1 - γ
Ф(tkp) = (1 - γ)/2 = 0.9335/2 = 0.4668
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.4668
tkp(γ) = (0.4668) = 1.84
Доля i-ой группы fi / ∑f |
Средняя ошибка выборки для генеральной доли, ε |
Нижняя граница доли, p* + ε |
Верхняя граница доли, p* + ε |
0.0694 |
0.064 |
0.0747 | |
0.29 |
0.28 |
0.3 | |
0.39 |
0.38 |
0.4 | |
0.17 |
0.17 |
0.18 | |
0.0371 |
0.0332 |
0.0411 | |
0.0336 |
0.0298 |
0.0373 | |
0.00224 |
0.00125 |
0.00322 |
С вероятностью 0.9783 при большем объеме выборке эти доли будут находиться в заданных интервалах.
Задача 2.4
Для 12 предприятий региона получены следующие данные о производительности труда Y, тыс. руб., в расчете на одного работающего в зависимости от энерговооруженности труда X, кВТ, (i – номер варианта = 8)
№ предприятия |
Энерговооруженность Х, кВТ |
Производительность труда Y, тыс. руб |
1 |
2,9 |
6,78 |
2 |
2,8 |
6,88 |
3 |
3 |
7,18 |
4 |
3,8 |
7,85 |
5 |
3,18 |
8,84 |
6 |
3,81 |
8,88 |
7 |
4,18 |
9,18 |
8 |
4,8 |
9,88 |
9 |
6,8 |
10,78 |
10 |
5,84 |
11,18 |
11 |
5,28 |
11,88 |
12 |
7,18 |
12,18 |
Необходимо: а) оценить тесноту
и направление связи между
переменными с помощью
Решение:
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
x |
y |
x2 |
y2 |
x • y |
2.9 |
6.78 |
8.41 |
45.97 |
19.66 |
2.8 |
6.88 |
7.84 |
47.33 |
19.26 |
3 |
7.18 |
9 |
51.55 |
21.54 |
3.8 |
7.85 |
14.44 |
61.62 |
29.83 |
3.18 |
8.84 |
10.11 |
78.15 |
28.11 |
3.81 |
8.88 |
14.52 |
78.85 |
33.83 |
4.18 |
9.18 |
17.47 |
84.27 |
38.37 |
4.8 |
9.88 |
23.04 |
97.61 |
47.42 |
6.8 |
10.78 |
46.24 |
116.21 |
73.3 |
5.84 |
11.18 |
34.11 |
124.99 |
65.29 |
5.28 |
11.88 |
27.88 |
141.13 |
62.73 |
7.18 |
12.18 |
51.55 |
148.35 |
87.45 |
53.57 |
111.49 |
264.61 |
1076.05 |
526.81 |
1. Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое
1.1. Коэффициент корреляции
Ковариация.
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X весьма высокая и прямая.
1.2. Уравнение регрессии (оценка уравнения регрессии).
Линейное уравнение регрессии имеет вид y = 1.14 x + 4.19
Коэффициентам уравнения линейной регрессии можно придать экономический смысл.
Коэффициент регрессии b = 1.14
показывает среднее изменение
Коэффициент a = 4.19 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.
Но если х=0 находится далеко
от выборочных значений х, то буквальная
интерпретация может привести к
неверным результатам, и даже если линия
регрессии довольно точно описывает
значения наблюдаемой выборки, нет
гарантий, что также будет при
экстраполяции влево или
Подставив в уравнение
регрессии соответствующие
Связь между у и х определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе - обратная). В нашем примере связь прямая.
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
12a + 53.57 b = 111.49
53.57 a + 264.61 b = 526.81
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 1.1429, a = 4.1887
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 1.1429 x + 4.1887
Построим график:
Задача 1.7
Для анализа активности инвесторов
на фондовой бирже за квартал, по схеме
собственно-случайной
Информация о работе Контрольная работа по "Математической статистике"