Контрольная работа по "Математической статистике"

Автор работы: Пользователь скрыл имя, 30 Апреля 2013 в 06:34, контрольная работа

Описание работы

1. а) Определить границы, в которых с надежностью 0,9335 заключен средний месячный доход жителей города
б) каким должен быть объем выборки, чтобы те же границы гарантировать с надежностью 0,9855 ?
2. Определить границы, в которых с надежностью 0,9783 заключена доля наиболее обеспеченного населения города (12 и более минимальных заработных плат) и доля наименее обеспеченного населения города (менее 2 минимальных заработных плат).
3. Каким должен быть объем выборки , чтобы те же границы для доли наименее обеспеченного населения города гарантировать с надежностью 0,9873 ?
4. Как изменились бы результаты, полученные в п.3, если бы о доле наиболее обеспеченного населения региона вообще не было ничего известно?

Файлы: 1 файл

Л_994_математическая статистика (2).docx

— 66.24 Кб (Скачать файл)

Задача 1.4

Для оценки уровня жизни  жителей города проведен 1%-й опрос, по схеме собственно-случайной бесповторной выборки. Получено следующее распределение  жителей по месячному доходу Х (количество минимальных заработных плат):

 

Количество

минимальных

заработных плат хi

Менее  2

2-4

4-6

6-8

8-10

10-12

Более 12

Число жителей ni

155

657

870

390

83

75

5


 

1. а) Определить границы,  в которых с надежностью 0,9335 заключен средний месячный доход  жителей города

   б) каким должен  быть объем выборки, чтобы те  же границы гарантировать с  надежностью 0,9855 ?

2. Определить границы,  в которых с надежностью 0,9783 заключена доля наиболее обеспеченного  населения города (12 и более минимальных  заработных плат) и доля наименее  обеспеченного населения города (менее 2 минимальных заработных  плат).

3. Каким должен быть  объем выборки , чтобы те же границы для доли наименее обеспеченного населения города гарантировать с надежностью 0,9873 ?

4. Как изменились бы  результаты, полученные в п.3, если  бы о доле наиболее обеспеченного  населения региона вообще не  было ничего известно?

 

 

Решение:

Проведем следующие расчеты:

 

Группы

xi

Кол-во, fi

xi * fi

Накопленная частота, S

(x - xср) * f

(x - xср)2 * f

Частота, fi/n

до 2

1.5

155

232.5

155

524.85

1777.21

0.0694

2 - 4

3

657

1971

812

1239.19

2337.27

0.29

4 - 6

5

870

4350

1682

99.07

11.28

0.39

6 - 8

7

390

2730

2072

824.41

1742.69

0.17

8 - 10

9

83

747

2155

341.45

1404.69

0.0371

10 - 12

11

75

825

2230

458.54

2803.46

0.0336

Более 12

13

5

65

2235

40.57

329.17

0.00224

 

 

 

 

2235

10920.5

 

 

3528.07

10405.77

1


 

Для оценки ряда распределения  найдем следующие показатели:

Средняя взвешенная

 

 

Вычислим выборочную дисперсию:

 

xц

x*i

x*ifi

[x*i]2fi

1.5

-1.75

-271.25

474.69

3

-1

-657

657

5

0

0

0

7

1

390

390

9

2

166

332

11

3

225

675

13

4

20

80

 

 

 

 

-127.25

2608.69


 

 

 

Среднее квадратическое отклонение (средняя ошибка выборки).

 

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

 

 

Каждое значение ряда отличается от другого не более, чем на 1.58

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

 

 

Несмещенная оценка дисперсии - состоятельная оценка дисперсии.

 

 

Среднее квадратическое отклонение (средняя ошибка выборки).

 

Каждое значение ряда отличается от среднего значения 4.89 не более, чем на 2.16

Оценка среднеквадратического  отклонения.

 

Определить границы, в  которых с надежностью 0,9335 заключен средний месячный доход жителей  города

 

или

 

где d  - процент выборки.

Определяем значение tkp по таблицам функции Лапласа.

В этом случае 2Ф(tkp) = 1 - γ

Ф(tkp) = (1 - γ)/2 = 0.9335/2 = 0.4668

По таблице функции  Лапласа найдем, при каком tkp значение Ф(tkp) = 0.4668

tkp(γ) = (0.4668) = 1.84

 

(4.89 - 0.0836;4.89 + 0.0836) = (4.8;4.97)

С вероятностью 0.9335 можно  утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.

 

или

 

где d  - процент выборки.

Поскольку n ≤ 30, то определяем значение tkp по таблице распределения Стьюдента

По таблице Стьюдента  находим:

Tтабл (n-1;α/2) = (7;0) = 6

 

(1 - 0;1 + 0) = (1;1)

С вероятностью 0 можно утверждать, что среднее значение при выборке  большего объема не выйдет за пределы  найденного интервала.

Найдем доверительный  интервал для среднеквадратического  отклонения с надежностью γ = 0.9783.

Нижняя ошибка среднеквадратического  отклонения:

 

Верхняя ошибка среднеквадратического  отклонения:

 

(2.16 - 6.57; 2.16 + 6.57)

(-4.41; 8.73)

Найдем верхнюю границу  доверительного интервала для среднеквадратического  отклонения:

 

0 ≤ σ ≤ 6.57

Доверительный интервал для  генеральной доли.

 

Определяем значение tkp по таблицам функции Лапласа.

В этом случае 2Ф(tkp) = 1 - γ

Ф(tkp) = (1 - γ)/2 = 0.9335/2 = 0.4668

По таблице функции  Лапласа найдем, при каком tkp значение Ф(tkp) = 0.4668

tkp(γ) = (0.4668) = 1.84

 

Доля i-ой группы fi / ∑f

Средняя ошибка выборки для  генеральной доли, ε

Нижняя граница доли, p* + ε

Верхняя граница доли, p* + ε

0.0694

 

0.064

0.0747

0.29

 

0.28

0.3

0.39

 

0.38

0.4

0.17

 

0.17

0.18

0.0371

 

0.0332

0.0411

0.0336

 

0.0298

0.0373

0.00224

 

0.00125

0.00322


 

 

С вероятностью 0.9783 при большем  объеме выборке эти доли будут  находиться в заданных интервалах.

 

 

Задача 2.4

Для 12 предприятий региона  получены следующие данные о производительности труда Y, тыс. руб., в расчете на одного работающего в зависимости от энерговооруженности труда X, кВТ, (i – номер варианта = 8)

предприятия

Энерговооруженность Х, кВТ

Производительность труда  Y, тыс. руб

1

2,9

6,78

2

2,8

6,88

3

3

7,18

4

3,8

7,85

5

3,18

8,84

6

3,81

8,88

7

4,18

9,18

8

4,8

9,88

9

6,8

10,78

10

5,84

11,18

11

5,28

11,88

12

7,18

12,18


 

Необходимо: а) оценить тесноту  и направление связи между  переменными с помощью коэффициента корреляции; б) найти уравнения прямых регрессии построить их графики.

Решение:

Для расчета параметров регрессии  построим расчетную таблицу (табл. 1)

x

y

x2

y2

x • y

2.9

6.78

8.41

45.97

19.66

2.8

6.88

7.84

47.33

19.26

3

7.18

9

51.55

21.54

3.8

7.85

14.44

61.62

29.83

3.18

8.84

10.11

78.15

28.11

3.81

8.88

14.52

78.85

33.83

4.18

9.18

17.47

84.27

38.37

4.8

9.88

23.04

97.61

47.42

6.8

10.78

46.24

116.21

73.3

5.84

11.18

34.11

124.99

65.29

5.28

11.88

27.88

141.13

62.73

7.18

12.18

51.55

148.35

87.45

53.57

111.49

264.61

1076.05

526.81


 

1. Параметры уравнения  регрессии.

Выборочные средние.

 

 

 

Выборочные дисперсии:

 

 

Среднеквадратическое отклонение

 

 

1.1. Коэффициент  корреляции

Ковариация.

 

Рассчитываем показатель тесноты связи. Таким показателем  является выборочный линейный коэффициент  корреляции, который рассчитывается по формуле:

 

Линейный коэффициент  корреляции принимает значения от –1 до +1.

Связи между признаками могут  быть слабыми и сильными (тесными). Их критерии оцениваются по шкале  Чеддока:

0.1 < rxy < 0.3: слабая;

0.3 < rxy < 0.5: умеренная;

0.5 < rxy < 0.7: заметная;

0.7 < rxy < 0.9: высокая;

0.9 < rxy < 1: весьма высокая;

В нашем примере связь  между признаком Y фактором X  весьма высокая и прямая.

1.2. Уравнение регрессии (оценка уравнения регрессии).

 

Линейное уравнение регрессии  имеет вид y = 1.14 x  + 4.19

Коэффициентам уравнения  линейной регрессии можно придать  экономический смысл.

Коэффициент регрессии b = 1.14 показывает среднее изменение результативного  показателя (в единицах измерения  у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением  на 1 единицу y повышается в среднем  на 1.14.

Коэффициент a = 4.19 формально  показывает прогнозируемый уровень  у, но только в том случае, если х=0 находится близко с выборочными  значениями.

Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к  неверным результатам, и даже если линия  регрессии довольно точно описывает  значения наблюдаемой выборки, нет  гарантий, что также будет при  экстраполяции влево или вправо.

Подставив в уравнение  регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.

Связь между у и х определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе - обратная). В нашем примере связь прямая.

Система нормальных уравнений.

a•n + b∑x = ∑y

a∑x + b∑x2 = ∑y•x

Для наших данных система  уравнений имеет вид

12a + 53.57 b = 111.49

53.57 a + 264.61 b  = 526.81

Из первого уравнения  выражаем а и подставим во второе уравнение:

Получаем эмпирические коэффициенты регрессии: b = 1.1429, a = 4.1887

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 1.1429 x + 4.1887

Построим график:

 

Задача 1.7

Для анализа активности инвесторов на фондовой бирже за квартал, по схеме  собственно-случайной бесповторной выборки было отобрано 450 инвесторов. Получено следующее распределение  инвесторов по числу сделок за квартал:

Информация о работе Контрольная работа по "Математической статистике"