Контрольная работа по "Статистике"

Автор работы: Пользователь скрыл имя, 02 Апреля 2011 в 18:37, контрольная работа

Описание работы

1. Объяснить связь между формулой сложения дисперсий и корреляционным отношением, разъяснить его статистический смысл.
2. Выполнить сравнение вариации для двух различных распределений с различными средними, объяснить условия сопоставимости при различии средних.
3. Дать наиболее полное объяснение смысла предельной ошибки, связать с понятием репрезентативности выборки и ее необходимым объемом.
4. Объяснить соотношение оценивания неизвестных параметров по МНК и проверку значимости полученных результатов по критериям проверки статистических гипотез.

Файлы: 1 файл

Итоговый контроль задача.doc

— 221.00 Кб (Скачать файл)
 

     В рассматриваемом примере используется ряд с равными интервалами, величина которых 0,5 тыс. руб. Тогда условная нижняя граница первого интервала  будет равна: 0,5 тыс. руб. - 0,5 тыс. руб. = 0, а середина - 0,25 тыс. руб., условная верхняя граница последнего интервала: 3,0 тыс. руб. + 0,5 тыс. руб. = 3,5 тыс. руб., а середина - 3,25 тыс. руб.

     Расчет  средней величины месячного среднедушевого денежного дохода:

х = = 5112,75/2809 = 1,82 тыс. руб.

     Месячный  среднедушевой доход составляет 1820 руб.

     Можно при расчете средней величины в качестве весов использовать частости распределения (w). Величина средней  от этого не меняется.

х = 182,0/100 = 1,82 тыс. руб.

     Рассчитаем  модальное значение признака:

Мо = 1,0 + 0,5*((24,6 - 16,5)/(24,6 - 16,5) + (24,6 - 18,8)) = 1,29 тыс. руб.

     Таким образом, величина среднедушевого дохода составляет 1290 руб.

     По  данным таблицы находим интервал, сумма накопленных частот в котором  превышает 50%. Это интервал от 1,5 до 2,0 тыс. руб. (S = 60,8%), он и является медианным.

Ме = 1,5 + 0,5 * ((0,5*(100 + 1) - 42,0)/18,8) = 1,72 тыс. руб.

     Следовательно, половина жителей города в нашем  примере имеет месячный среднедушевой  доход меньше 1720 руб., а половина - больше этой суммы.

     Расчет  медианного значения по частостям распределения даст аналогичный результат:

Ме = 1,5 + 0,5* ((0,5*(2809 + 1) - 1179)/528) = 1,72 тыс. руб.,

где 1179 - сумма накопленных частот в домедианом интервале.

     Соотношение х>Ме>Мо (1820 руб. > 1720 руб. > 1290 руб.), характерное для правосторонней асимметрии, что подтверждается графиками - гистограммой и полигоном распределения. Наличие правосторонней асимметрии свидетельствует о том, что большая  часть жителей города имела месячный среднедушевой доход выше, чем его модальное значение (1290 руб.).

     Для нашего примера первая дециль попадает в интервал от 0,5 до 1,0 тыс. руб. (сумма  накопленных в этом интервале  составляет 17,4%, что превышает 10%), девятая  дециль - в интервал от 3,0 тыс. руб. и более (в этом интервале находится 10% населения с наибольшими доходами). Найдем величину соответствующих децилей.

D1 = 0,5 + 0,5*((0,1*100 - 0,9)/(16,5)) = 0,776 тыс. руб.

     Следовательно, максимальная величина месячного среднедушевого дохода у 10% наименее обеспеченных жителей составляла 776 руб.

D9 = 3,0 + 0,5*((0,9*100 - 88,7)/(11,3)) = 3,058 тыс. руб.

     Минимальная величина месячного среднедушевого дохода у 10% наиболее обеспеченного  населения города составляла 3058.

     Коэффициент децильной дифференциации доходов населения:

КD = 3058/776 = 3,9.

     Это означает, что минимальный месячный среднедушевой доход 10% наиболее обеспеченного  населения превышал максимальный доход 10% наименее обеспеченного населения  в 3,9 раза.

     Определим среднее линейное, среднее квадратическое отклонение и дисперсии для распределения жителей города по величине месячного среднедушевого дохода.

    Среднедушевой денежный доход в  среднем за месяц, тыс. руб. Число жителей, в % к итогу (fi) Середина  интервала (xi) х - х

    (х=1,82)

    х - х f (х  - х) f
    До 0,5 0,9 0,25 1,57 1,413 2,218
    0,5 - 1,0 16,5 0,75 1,07 17,655 18,891
    1,0 - 1,5 24,6 1,25 0,57 14,022 7,993
    1,5 - 2,0 18,8 1,75 0,07 1,316 0,092
    2,0 - 2,5 15,4 2,25 0,43 6,622 2,847
    2,5 - 3,0 12,5 2,75 0,93 11,625 10,811
    3,0 и  более 11,3 3,25 1,43 16,159 23,107
    Итого 100,0 - - 68,812 65,959
 

     Среднее линейное отклонение:

d = 68,812/100 = 0,688 тыс. руб.;

     Дисперсия:

= 65,959/100 = 0,660;

     Среднее квадратическое отклонение:

= 0,660 = 0,812 тыс. руб.

     Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем величина месячного среднедушевого дохода жителей города отличалась от среднего дохода по городу. По формуле среднего линейного отклонения это отличие составляло + 688 руб., по формуле среднего квадратического отклонения + 812 руб.

     Коэффициент составляет:

V = (812/1820)*100% = 44,6%, что говорит о средней  колеблемости признака и, следовательно,  о средней однородности совокупности  жителей города по величине  среднедушевых доходов.

  1. Дать наиболее полное объяснение смысла предельной ошибки, связать с понятием репрезентативности выборки и ее необходимым объемом.

   Предельная  ошибка выборки связана со средней ошибкой выборки отношением:

    .

   При этом t как коэффициент кратности  средней ошибки выборки зависит  от значения вероятности Р, с которой  гарантируется величина предельной ошибки выборки.

   Предельная  ошибка выборки при бесповторном отборе определяется по следующим формулам:

,   .

   Предельная  ошибка выборки при повторном  отборе определяется по формуле:

,    .

     Выборочной  совокупностью или просто выборкой называется множество числовых значений некоторого признака всех объектов, случайным образом отобранных из всей совокупности рассматриваемых объектов.

     Если  же изучать не срок службы, а, например, вес лампочек, что тоже может иметь  практическое значение, то та же совокупность объектов будет приводить к другим генеральной совокупности и выборке.

недвусмысленно  известно, о каком признаке идет речь, под «генеральной совокупностью» и под «выборкой» будем понимать саму совокупность изучаемых объектов.

     Основную  задачу математической статистики можно  сформулировать как задачу получения обоснованных выводов о неизвестных свойствах генеральной совокупности по известным свойствам извлеченной из нее выборки.

     Различают выборки с возвращением и без  возвращения.

     Если  после фиксирования значения параметра  объект возвращается в генеральную совокупность и, таким образом, он может многократно повторяться в выборке, то говорят о выборке с возвращением или с повторением.

     Если  же раз отобранный объект обратно  не возвращается и он не может больше одного раза повторяться в выборке, то такая выборка называется выборкой без возвращения или без повторения.

     Когда объем выборки намного меньше объема генеральной совокупности, то различие между выборкой с возвращением и без возвращения практически  исчезает.

     Говорят, что выборка репрезентативна (представительна), если она достаточно полно представляет изучаемые признаки генеральной совокупности.

     Важным  условием обеспечения репрезентативности выборки является соблюдение случайности  отбора, Т.

все объекты  генеральной совокупности должны иметь  равные вероятности попасть в выборку.

     С целью обеспечения репрезентативности выборки в зависимости от конкретных условий применяются различные  способы отбора: простой, типический, механический, серийный.

     Например, если детали изготовляются разными  цехами, то для обеспечения репрезентативности выборки отбор производится случайным образом с соблюдением пропорций из продукции каждого цеха.

     Например, если резец заменяется после тридцати обработанных деталей, то нельзя составлять выборку, отбирая каждую десятую или пятнадцатую деталь.

Тогда в выборку попадут объекты  из различных моментов периода ритма.

  1. Объяснить соотношение оценивания неизвестных параметров по МНК и проверку значимости полученных результатов по критериям проверки статистических гипотез.

   Регрессии, нелинейные по оцениваемым параметрам:

    • степенная
    • показательная
    • экспоненциальная

     Построение  уравнения регрессии сводится к  оценке её параметров. Для оценки параметров регрессий,  линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака y от расчетных значений , найденных по уравнению регрессии, была минимальной, т.е. суть МНК заключается в минимизации суммы квадратов остатков:

     Для линейных уравнений и нелинейных уравнений, приводимых к линейным уравнениям, решается следующая система относительно a и b:

     Можно воспользоваться готовыми формулами, которые являются решением этой системы:

     

     Тесноту связи изучаемых явлений оценивает  линейный коэффициент парной корреляции  для линейной регрессии:

       где n – объём выборки; - выборочные средние.

     Для оценки статистической значимости коэффициента регрессии b, постоянной а и коэффициента корреляции рассчитываются фактические значения t - критерия Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости показателей с помощью t - критерия Стьюдента проводится путём сопоставления значения показателей с величиной их стандартных ошибок, т.е.  определяются фактические значения t - критерия Стьюдента:

     Стандартные ошибки коэффициента регрессии, константы и коэффициента корреляции рассчитываются по формулам:

,

где , m – число параметров при независимой переменной  x. Величина S называется стандартной ошибкой регрессии и служит мерой разброса зависимой переменной (результата) вокруг линии регрессии.

     Сравнивая фактическое  значение t – статистики с критическим (табличным) значением при определенном уровне значимости (обычно =0,05) и числе степеней свободы (n-2), делаем соответствующие выводы.

     Если  , то отклоняется, т.е. и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x.

Информация о работе Контрольная работа по "Статистике"