Анализ статистической совокупности

Автор работы: Пользователь скрыл имя, 12 Апреля 2010 в 20:01, Не определен

Описание работы

решение задач
Задача статистического исследования – освоить методику анализа структуры статистической совокупности с использованием компьютерных средств экономико-статистических расчетов, научится использовать аналитические группировки в выявлении взаимосвязей между явлениями.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Файлы: 1 файл

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ.doc

— 178.50 Кб (Скачать файл)
p>       Задача 3.

       3,а. Если величина Vσ удовлетворяет условию 0%<Vσ≤40%, то степень колеблемости незначительна. В данной совокупности выполняется это условие.

       0%<23,0663639≤40%

       0%<23,79170449≤40%

       3,б. Совокупность является количественно однородной по тому или иному признаку, когда выполняется неравенство Vσ≤33%. Коэффициенты вариации по каждому признаку удовлетворяют данному условию. Следовательно, совокупности являются количественно однородными.

       3,в. Если , то значения признака неустойчивы. В них имеются «аномальные» выбросы.

         

       

       Следовательно, несмотря на визуальное обнаружение  и исключение нетипичных единиц наблюдения при выполнении задания 1, некоторые  аномалии в первичных данных продолжают сохраняться.

       Аномалии  следует выявить и удалить  из выборки.

       3,г. 

       Обобщим данные и составим таблицу

Таблица 9

Распределение значений признака по диапазонам рассеяния  признака относительно 

  Границы диапазонов Количество  значений xi, находящихся в диапазоне
Первый  признак Второй признак Первый признак Второй признак
153,5851822≤xi≤ 245,6814844 109,1048764≤xi≤177,228457 23/76,7% 21/65,6%
107,537031≤xi≤ 291,7296356 75,04308618≤xi≤211,2902472 28/87,5% 29/90,6%
61,48887991≤xi≤ 337,7777867 40,98129592≤xi≤245,3520375 31/96,9% 32/100%

       Согласно  вероятностной теореме П.Л. Чебышева, следует ожидать, что независимо от формы распределения 75% значений признака будут находиться в диапазоне ( ), а 89% значений – в диапазоне ( )

       В нормально распределенных и близких  к ним рядах вероятные оценки диапазонов рассеяния значений признака таковы:

       - 68,3% войдет в диапазон ( )

       - 95,4% попадет в диапазон ( )                                                                       (1)

       - 99,7% появится в диапазоне ( )

       Соотношение (1) известно как правило «трех  сигм».

       В нашем случае значения каждого из признаков отлично от правила  «трех сигм». Значения второго признака ближе к правилу. 

       Задача 4.

       4,а. Размах вариации R= Х max min. R для первого признака – 204 млн руб., для второго – 140 млн руб.. Размах вариации устанавливает предельное значение амплитуды колебаний признака.

Среднее линейное отклонение по первому признаку равно  35,44, по второму - 28,42222222. В условиях симметричного и нормального, а также близких к ним распределениям между показателями σ и d имеет место равенство: d ≈ 0,8 σ.

       Первый  признак: d ≈ 0,8*46,04815113 ≈ 36,838520904.

       Второй  признак: d ≈ 0,8*34,06179026 ≈ 27,249432208

       Рассчитанные  по формуле значения приблизительно равны значениям, рассчитанным с  помощью программы MS Excel.

       Дисперсия σn2 оценивает средний квадрат отклонений ( ). Величина σ очень чутко реагирует на вариацию признака (за счет возведения отклонений в квадрат) и органически вписывается в аппарат математической статистики (дисперсионный, корреляционный анализ и др.). Дисперсия первого признака (2120,432222) более, чем в 1,5 раза превосходит значение дисперсии второго признака (1160,205556).

       Среднее квадратическое отклонение σ показывает, насколько в среднем отклоняются индивидуальные значения признака хi от их средней величины . Так, индивидуальные значения первого признака отличаются от на 46,04815113 млн руб., а второго – на 34,06179026 млн руб..

       4,б.  Совокупность является количественно однородной по тому или иному признаку, когда выполняется неравенство Vσ≤33%. Коэффициенты вариации по каждому признаку удовлетворяют данному условию. Следовательно, совокупности являются количественно однородными.

       4,в. Для оценки надежности (типичности) средней величины х можно воспользоваться значением показателя вариации Vσ. Если его значение невелико, т.е. <40% (как в нашем случае), то индивидуальные значения признака хi мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, средняя арифметическая величина является надежной характеристикой данной совокупности.

       4,г.  Если As<0, то асимметрия левосторонняя, если As>0, то асимметрия правосторонняя. И для первого (0,708678471), и для второго (0,856286955) признака асимметрия левосторонняя.

       │As│>0,5. Следовательно, асимметрия существенная. 

       Задача 5.

       Интервальный  вариационный ряд распределения единиц совокупности по признаку  представлен в таблице 7. Гистограмма и кумулята интервального ряда распределения предприятий изображены на Диаграмме 2.

       Для полученного интервального ряда значение моды рассчитывается по формуле:

       

         млн руб.

       Значение  моды в таблице 3 – Мо=167 млн руб.. 

       Для несгруппированных данных мода - это  значение признака с наибольшей частотой появления. В интервальном ряду вычисление моды весьма условно. Поэтому между  ними могут быть различия. 
 

Анализ  генеральной совокупности. 

       Задача 1.

       На  основе имеющихся данных составим таблицу

Таблица 10

Описательные  статистики генеральной  совокупности

Среднегодовая стоимость 
основных производственных 
фондов, млн руб.
  Выпуск продукции, 
млн руб.
 
Столбец1   Столбец2  
Стандартное отклонение, σN 46,83535603 Стандартное отклонение, σN 34,64408526
Дисперсия выборки, σN2 2193,550575 Дисперсия выборки, σN2 1200,212644
Эксцесс, Ek 0,438466983 Эксцесс, Ek -0,36007995
Асимметричность, As -0,03462322 Асимметричность, As 0,085504193

       

       

       

       

       В нашем случае обе дисперсии совпадают.

       Rn =204 млн руб.

       RN =6σN

       RN=281 млн руб.

       Значение  размаха вариации различно, поскольку  из генеральной совокупности были удалены  аномальные значения признаков.  

       Задача 2.

       2,a. Средняя ошибка выборки (µЧ̃ ) первого признака - 8,550926996 млн руб., второго - 6,325115661млн руб..

       2,б.  Предельная ошибка выборки ΔЧ̃ определяет границы, в пределах которых лежит генеральная средняя . Эти границы задают так называемый доверительный интервал генеральной средней – случайную область значений, которая с вероятностью Р, близкой к 1, гарантированно содержит значение генеральной средней. Эту вероятность называют доверительной вероятностью или уровнем надежности. Наиболее часто используются уровни надежности Р=0,954; Р=0,997; Р=0,683.

       В математической статистике доказано, что: ΔЧ̃=t* µЧ̃.

       Составим  таблицу

       Таблица 8

       Предельные  ошибки выборки и  ожидаемые границы  для генеральных  средних 

Доверительная вероятность Коэффициент доверия t Предельные  ошибки выборки Ожидаемые границы для средних 
для первого признака для второго  признака для первого  признака для второго  признака
0,683 1 8,70660336 6,440269376 190,92672994≤
≤208,33993666
136,726397324≤
≤149,606936076
0,954 2 17,82706705 13,18667099 181,80626625≤
≤217,46040035
129,97999571≤
≤156,35333769
0,997 3 27,69995902 20,48964337 171,93337428≤
≤227,33329232
122,67702333≤
≤163,65631007
 

       Таким образом, предельная ошибка выборки позволяет определить предельные значения показателей генеральной совокупности и их доверительные интервалы.  

       Задача 3.

       Если  As<0, то асимметрия левосторонняя, если As>0, то асимметрия правосторонняя. Для первого признака асимметрия левосторонняя (-0,03462322), для второго – правосторонняя (0,085504193).

       │As│≤0,25. Следовательно, асимметрия незначительная.

       Для первого признака Ek>0. Следовательно, вершина кривой распределения располагается выше вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средним.

       Для второго признака Ek<0. Следовательно, вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от Хmax до Хmin.

       │Ek│ не значителен. Следовательно, кривая распределения незначительно отличается от нормальной.

Информация о работе Анализ статистической совокупности