Автор работы: Пользователь скрыл имя, 12 Апреля 2010 в 20:01, Не определен
решение задач
Задача статистического исследования – освоить методику анализа структуры статистической совокупности с использованием компьютерных средств экономико-статистических расчетов, научится использовать аналитические группировки в выявлении взаимосвязей между явлениями.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
3,а. Если величина Vσ удовлетворяет условию 0%<Vσ≤40%, то степень колеблемости незначительна. В данной совокупности выполняется это условие.
0%<23,0663639≤40%
0%<23,79170449≤40%
3,б. Совокупность является количественно однородной по тому или иному признаку, когда выполняется неравенство Vσ≤33%. Коэффициенты вариации по каждому признаку удовлетворяют данному условию. Следовательно, совокупности являются количественно однородными.
3,в. Если , то значения признака неустойчивы. В них имеются «аномальные» выбросы.
Следовательно, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдения при выполнении задания 1, некоторые аномалии в первичных данных продолжают сохраняться.
Аномалии следует выявить и удалить из выборки.
3,г.
Обобщим данные и составим таблицу
Таблица 9
Распределение
значений признака по
диапазонам рассеяния
признака относительно
| Границы диапазонов | Количество значений xi, находящихся в диапазоне | |||
| Первый признак | Второй признак | Первый признак | Второй признак | |
| 153,5851822≤xi≤ 245,6814844 | 109,1048764≤xi≤177,228457 | 23/76,7% | 21/65,6% | |
| 107,537031≤xi≤ 291,7296356 | 75,04308618≤xi≤211,2902472 | 28/87,5% | 29/90,6% | |
| 61,48887991≤xi≤ 337,7777867 | 40,98129592≤xi≤245,3520375 | 31/96,9% | 32/100% | |
Согласно вероятностной теореме П.Л. Чебышева, следует ожидать, что независимо от формы распределения 75% значений признака будут находиться в диапазоне ( ), а 89% значений – в диапазоне ( )
В нормально распределенных и близких к ним рядах вероятные оценки диапазонов рассеяния значений признака таковы:
- 68,3% войдет в диапазон ( )
-
95,4% попадет в диапазон (
)
- 99,7% появится в диапазоне ( )
Соотношение (1) известно как правило «трех сигм».
В
нашем случае значения каждого из
признаков отлично от правила
«трех сигм». Значения второго признака
ближе к правилу.
Задача 4.
4,а. Размах вариации R= Х max-Х min. R для первого признака – 204 млн руб., для второго – 140 млн руб.. Размах вариации устанавливает предельное значение амплитуды колебаний признака.
Среднее линейное отклонение по первому признаку равно 35,44, по второму - 28,42222222. В условиях симметричного и нормального, а также близких к ним распределениям между показателями σ и d имеет место равенство: d ≈ 0,8 σ.
Первый признак: d ≈ 0,8*46,04815113 ≈ 36,838520904.
Второй признак: d ≈ 0,8*34,06179026 ≈ 27,249432208
Рассчитанные по формуле значения приблизительно равны значениям, рассчитанным с помощью программы MS Excel.
Дисперсия σn2 оценивает средний квадрат отклонений ( ). Величина σ очень чутко реагирует на вариацию признака (за счет возведения отклонений в квадрат) и органически вписывается в аппарат математической статистики (дисперсионный, корреляционный анализ и др.). Дисперсия первого признака (2120,432222) более, чем в 1,5 раза превосходит значение дисперсии второго признака (1160,205556).
Среднее квадратическое отклонение σ показывает, насколько в среднем отклоняются индивидуальные значения признака хi от их средней величины . Так, индивидуальные значения первого признака отличаются от на 46,04815113 млн руб., а второго – на 34,06179026 млн руб..
4,б. Совокупность является количественно однородной по тому или иному признаку, когда выполняется неравенство Vσ≤33%. Коэффициенты вариации по каждому признаку удовлетворяют данному условию. Следовательно, совокупности являются количественно однородными.
4,в. Для оценки надежности (типичности) средней величины х можно воспользоваться значением показателя вариации Vσ. Если его значение невелико, т.е. <40% (как в нашем случае), то индивидуальные значения признака хi мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, средняя арифметическая величина является надежной характеристикой данной совокупности.
4,г. Если As<0, то асимметрия левосторонняя, если As>0, то асимметрия правосторонняя. И для первого (0,708678471), и для второго (0,856286955) признака асимметрия левосторонняя.
│As│>0,5.
Следовательно, асимметрия существенная.
Задача 5.
Интервальный вариационный ряд распределения единиц совокупности по признаку представлен в таблице 7. Гистограмма и кумулята интервального ряда распределения предприятий изображены на Диаграмме 2.
Для полученного интервального ряда значение моды рассчитывается по формуле:
млн руб.
Значение моды в таблице 3 – Мо=167 млн руб..
Для
несгруппированных данных мода - это
значение признака с наибольшей частотой
появления. В интервальном ряду вычисление
моды весьма условно. Поэтому между
ними могут быть различия.
Анализ
генеральной совокупности.
Задача 1.
На основе имеющихся данных составим таблицу
Таблица 10
Описательные статистики генеральной совокупности
| Среднегодовая
стоимость основных производственных фондов, млн руб. |
Выпуск продукции, млн руб. |
||
| Столбец1 | Столбец2 | ||
| Стандартное отклонение, σN | 46,83535603 | Стандартное отклонение, σN | 34,64408526 |
| Дисперсия выборки, σN2 | 2193,550575 | Дисперсия выборки, σN2 | 1200,212644 |
| Эксцесс, Ek | 0,438466983 | Эксцесс, Ek | -0,36007995 |
| Асимметричность, As | -0,03462322 | Асимметричность, As | 0,085504193 |
В нашем случае обе дисперсии совпадают.
Rn =204 млн руб.
RN =6σN
RN=281 млн руб.
Значение
размаха вариации различно, поскольку
из генеральной совокупности были удалены
аномальные значения признаков.
Задача 2.
2,a. Средняя ошибка выборки (µЧ̃ ) первого признака - 8,550926996 млн руб., второго - 6,325115661млн руб..
2,б. Предельная ошибка выборки ΔЧ̃ определяет границы, в пределах которых лежит генеральная средняя . Эти границы задают так называемый доверительный интервал генеральной средней – случайную область значений, которая с вероятностью Р, близкой к 1, гарантированно содержит значение генеральной средней. Эту вероятность называют доверительной вероятностью или уровнем надежности. Наиболее часто используются уровни надежности Р=0,954; Р=0,997; Р=0,683.
В математической статистике доказано, что: ΔЧ̃=t* µЧ̃.
Составим таблицу
Таблица 8
Предельные
ошибки выборки и
ожидаемые границы
для генеральных
средних
| Доверительная вероятность | Коэффициент доверия t | Предельные ошибки выборки | Ожидаемые
границы для средних | ||
| для первого признака | для второго признака | для первого признака | для второго признака | ||
| 0,683 | 1 | 8,70660336 | 6,440269376 | 190,92672994≤ |
136,726397324≤ |
| 0,954 | 2 | 17,82706705 | 13,18667099 | 181,80626625≤ |
129,97999571≤ |
| 0,997 | 3 | 27,69995902 | 20,48964337 | 171,93337428≤ |
122,67702333≤ |
Таким
образом, предельная ошибка выборки позволяет
определить предельные значения показателей
генеральной совокупности и их доверительные
интервалы.
Задача 3.
Если As<0, то асимметрия левосторонняя, если As>0, то асимметрия правосторонняя. Для первого признака асимметрия левосторонняя (-0,03462322), для второго – правосторонняя (0,085504193).
│As│≤0,25. Следовательно, асимметрия незначительная.
Для первого признака Ek>0. Следовательно, вершина кривой распределения располагается выше вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средним.
Для второго признака Ek<0. Следовательно, вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от Хmax до Хmin.
│Ek│ не значителен. Следовательно, кривая распределения незначительно отличается от нормальной.