Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор работы: Пользователь скрыл имя, 07 Ноября 2010 в 09:53, Не определен

Описание работы

Лабораторная работа

Файлы: 1 файл

Отчет по лабе1.doc

— 388.00 Кб (Скачать файл)

в) устойчивость индивидуальных значений признаков;

     Сопоставление средних отклонений – квадратического  σ  и линейного позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений.

Расчет  устойчивости данных

По  столбцу «Среднегодовая стоимость  основных производственных фондов, млн. руб.» По столбцу  «Выпуск продукции млн. рублей.
                                             0,79                                               0,76
 

     В   условиях   симметричного   и   нормального,   а   также   близких   к   ним распределений между показателем σ и   имеют место равенства – σ ≈ l,25 , или   0,8σ, поэтому   отношение   показателей        и    σ   может    служить    индикатором устойчивости данных: если / σ (0,79столбец 1, 0,76 столбец 2) < 0,8, значения признака устойчивы, в них не имеется «аномальных» выбросов. 

г) количество попаданий индивидуальных значений признаков в диапазоны:

(

±σ), (
±2σ), (
  ± Зσ)
(Таблица 9).

Таблица 9

Распределение значений признака по диапазонам рассеяния признака  

Признаки Гграницы интервалов вариации признака Количество  значений признака х;, находящихся в диапазоне
    -σn<Хi< + σn -2σn<Хi< +2σn -3σn<Хi< + 3σn
Первый  признак        
Второй  признак        

  По  значениям показателей  и σ можно определить границы интервалов вариации признака, т.е. установить, какая доля единиц совокупности попадает в тот или иной интервал отклонений значений признака от .

  Согласно  вероятностной теореме П.Л.Чебышева следует ожидать, что независимо от формы распределения 75% значений признака будут находиться в интервале ±2σ, а 89% значений - в интервале ±3σ .

  В нормально распределенных и близких к ним рядах вероятностные оценки границ интервалов таковы:

      68,3% значений признака войдет в интервал          ± σ,

      95,4% значений признака попадет в интервал    ±2σ,                        (1)

    99,7% значений признака появится в интервале     ± Зσ.

Соотношение (1) известно, как правило «трех сигм».

     Для выборочной совокупности значения     и  σ п  рассчитаны и являются точными, поэтому, основываясь на правиле «трех сигм», можно точно оценить границы всех трех вероятностных интервалов отклонений значений признака от средней.

    Ожидаемые границы вариации выборки для  признака «Среднегодовая стоимость основных производственных фондов» соответствуют:

±σ с вероятностью Р=68,3%, т. е. ±253,969;

±2σ с вероятностью Р=95,4%, т. е. ±507,938;

±3σ с вероятностью Р=99,7%, т. е. ±761,907.

    Ожидаемые границы вариации выборки для  признака «Выпуск продукции» соответствуют:

±σ с вероятностью Р=68,3%, т. е. ±302,963;

±2σ с вероятностью Р=95,4%, т. е. ±605,926;

±3σ с вероятностью Р=99,7%, т. е. ±908,889.

    Для генеральной совокупности точно известна только величина σN, a величина рассчитывается, поэтому прогнозные оценки попадания значений признака в тот или иной интервал является прогнозным и обычно задается в форме (1) с учетом известного значения  σN

    Ожидаемые границы вариации генеральной совокупности для признака «Среднегодовая стоимость основных производственных фондов» соответствуют:

±σ с вероятностью Р=68,3%, т. е. ±253,969;

±2σ с вероятностью Р=95,4%, т. е. ±507,938;

±3σ с вероятностью Р=99,7%, т. е. ±761,907.

    Ожидаемые границы вариации генеральной совокупности для признака «Выпуск продукции» соответствуют:

±σ с вероятностью Р=68,3%, т. е. ±302,963;

±2σ с вероятностью Р=95,4%, т. е. ±605,926;

±3σ с вероятностью Р=99,7%, т. е. ±908,889.

     Учитывая  правило «трех сигм», в статистической практике величину Зσ считают в условиях нормального и близких к нему распределений максимально допустимой ошибкой наблюдения и отбрасывают результаты наблюдений для которых   

                                                           |хi-х| > 3σ                                              (2)

Для нормального  распределения справедливо равенство     

                                                                        R=6σ                                                         (3)

Задача 4

     Важная  функция обобщающих показателей  вариации , σ2, σ, - оценка надежности (типичности) средней величины.

    Для «Среднегодовая стоимость основных производственных фондов» значения показателей = 200,9 , σ2 = 62350,05 , σ = 253,969 , = 17,103 невелики, индивидуальные значения признака ряда мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, среднее арифметическая величина является надежной характеристикой данной совокупности.

    Для «Выпуск продукции» значения показателей = 229,46 , σ2 = 88726,87, σ=302,963 , = 21,749 невелики, индивидуальные значения признака ряда мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, среднее арифметическая величина является надежной характеристикой данной совокупности.

Задача 5

    Возможность отнесения кривой распределения  эмпирических данных к типу кривых нормального распределения устанавливается путем анализа формы гистограммы вариационного ряда распределения с учетом оценок показателей особенностей формы распределения (рис.2).

    При анализе формы гистограммы прежде всего следует оценить распределение вариантов значений признака по интервалам (группам). Гистограмма имеет одновершинную форму, поэтому можно считать выборку однородной по данному признаку.

    Установив однородность совокупности, для дальнейшего  анализа формы распределения используются описательные параметры выборки. Анализируются параметры и σп, выступающие в качестве статистических оценок соответствующих параметров нормального распределения - математического ожидания М[ ] и стандартного отклонения σ генеральной совокупности.

      Распределение приблизительно симметрично, так как параметры , Mo, Me  отличаются незначительно:

          = 1460                        Mo= 1512,5                Me= 1475,75

    Графический анализ показывает, что гистограмма приблизительно симметрична, ее «хвосты» не очень длинны, что позволяет судить о близости эмпирического распределения нормальному закону распределения.

    Результаты  визуального анализа не противоречат значениям полученных коэффициентов эксцесса и асимметрии, которые приведены в таблице: 

Коэффициент Значение коэффициента Анализ значения коэффициента
Эксцесса -0,345 Распределение пологое
Асимметрии -0,153 Асимметрия  низкая

      Следовательно, можно сделать заключение о близости изучаемого распределения к нормальному. 
 
 
 
 
 
 

II. Статистический анализ генеральной совокупности

Задача 1

     Генеральные показатели , , As, Ek рассчитаны с помощью инструмента Описательная статистика и их значение представлены в табл.3. Для этих показателей сформирована отдельная таблица 10.

Таблица 10

«Описательные статистики генеральной совокупности».

Наименование  показателя   Среднегодовая стоимость основных производственных фондов, млн.руб." "Выпуск  продукции, млн. руб."
Асимметричность   -0.153 0,043
Эксцесс   -0.345 -0.205
Дисперсия выборки 64500,052 91786,420
Стандартное отклонение σn 253,969 302,963
Дисперсия σ2n 

\

62350,05 88726,873 
Коэффициент асимметрии Asn -0,210 0,015

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel