Анализ данных как составляющая часть принятия решений

Автор работы: Пользователь скрыл имя, 23 Февраля 2011 в 22:56, контрольная работа

Описание работы

Определить с помощью метода Романовского принадлежность максимальных значений к выборкам, оценить однородность дисперсий и средних значений с использованием критерия Фишера и критерия Стьюдента.

Файлы: 1 файл

Моделирование производственных процессов.doc

— 114.50 Кб (Скачать файл)

Контрольная работа № 1

Вариант 1.

Анализ  данных как составляющая часть принятия решений 

Задание № 1 

    Определить  с помощью метода Романовского принадлежность максимальных значений к выборкам, оценить однородность дисперсий  и средних значений с использованием критерия Фишера и критерия Стьюдента.

Продолжительность рейса, дн.

Выборка:

  1. 7,8,6,7,12,8,6,7,13,7,8,9,7,8,8
  2. 7,7,8,9,6,6,7,8,8,8,9,8,7,7,9
 

Уровень значимость для 1-го варианта = 0,01 

Для оценки принадлежности резко выделяющихся значений общей  выборке рассчитывается величина ν :

ν = (Χ – Χ) / S , 

где Χ – максимальное значение в выборке;

       Χ*---– среднее значение;

       S – среднеквадратичное отклонение;  

Среднее значение и  среднее квадратичное отклонение рассчитываем по формулам: 

Χ--*** = Σ Χ / n  , 

S = Ö1/(n-1)* Σ (Χ – Χ)², 

Где n – объем выборки. 
 

Χ1 = 13                Χ2 = 9 

Χ1 = 121 / 15 = 8,07      Χ2 = 114/ 15 =7,6 

S1 = Ö 1/14*54,93 = Ö 3,92 = 1,98

S2 = Ö 1/14*13,6=  Ö0,9714 = 0,986 

ν1= (13-8,07) / 1,98 = 2,49

ν2= (9-7,6) / 0,986 = 1,42 

να= 3,07

  ν1 < να , следовательно, гипотезу о принадлежности резко выделяющихся значения к выборке, не отклоняем.

ν2 < να , следовательно, гипотезу о принадлежности резко выделяющихся значения к выборке, не отклоняем. 
 

Для сравнения дисперсий  двух выборок по методу Фишера используется

F –распределение F (k1,k2) , где k1 и k2 степени свободы, k1 = n – 1 и

k2 = n – 1. 

Критерий Фишера рассчитывается по формуле:  

Fэ = S²1 / S²2

 

Где S1> S2 

Fэ = 3,92/0,972 = 4,03 

Fэ таб = 2,4

    При заначении Fэ, большим критерия Фишера, расхождение дисперсий существеенно, исследование необходимо прекратить и принять меры по корректировке данных.

    Данные  первой выборки можно откорректировать – заменив наибольшее значение выборки, на любое другое значение в данной выборке, например = 8.

    Произведем  расчеты для  скорректированной  выборки.

Х1 = 12

 

Продолжительность рейса, дн.

Выборка:

  1. 7,8,6,7,12,8,6,7,8,7,8,9,7,8,8
  2. 7,7,8,9,6,6,7,8,8,8,9,8,7,7,9
 

Χ1 = 116 / 15 = 7,73       Χ2 = 114/ 15 =7,6 

S1 = Ö 1/14*28,4 = Ö 2,02 = 1,42

S2 = Ö 1/14*13,6=  Ö0,9714 = 0,986 

ν1= (12 – 7,73) / 1,42 = 3,001

ν2= (9-7,6) / 0,986 = 1,42 

να= 3,07

 

ν1 < να , следовательно гипотезу о принадлежности резко выделяющихся значения к выборке не отклоняем. 

ν2 < να , следовательно гипотезу о принадлежности резко выделяющихся значения к выборке не отклоняем. 

Для сравнения дисперсий  двух выборок по методу Фишера используется

F –распределение F (k1,k2) , где k1 и k2 степени свободы, k1 = n – 1 и

k2 = n – 1. 

Критерий Фишера рассчитывается по формуле:  

Fэ = S²1 / S²2

 

Где S1> S2 

Fэ =2,02 /0,972 = 2,08 

Fэ таб = 2,4

 

Fэ < Fэ таб , следовательно расхождение дисперсий носит случайный характер, выборки можно объединить в одну совокупность и приступить к оценке средних значений с помощью критерия Стьюдента. 

Рассчитываем величину t: 

t =(1 – Χ2| /Ö n1*s1² + n2*s2²)Ö n1* n2*(n1+ n2 – 2)/n1+ n2 , 

где s1²,s2² - смещенные оценки дисперсии 

s² = 1/n Σi – Χ)² 

s1² = 1/15 * 28,4 = 1,893

s2² = 1/15 * 13,6 = 0,906 

t = 0.13/6,48 *√ 210 = 0,02*14.49 = 0.3 

tтаб = 1,32 

tрасч < tтаб , следовательно, выборки данных являются непротиворечивыми и объединяются в одну совокупность. 
 
 
 
 

Задание № 2 

    Сделать прогноз, используя метод наименьших квадратов и метод экспоненциального  сглаживания. Произвести комбинированную оценку прогноза.

Объем перевозок автомобильным  транспортом РФ, млн.т. = yt

Таблица 1 

yt 100 129 168 153
t 1 2 3 4
 
 

Принимаем, что  модель тренда является линейной. 

y٭ = a + b * t 

a = (Σ yi * Σ ti - Σ ti * Σ (yi * ti )) / n * Σi    - (Σ ti  

b = (n * Σ( ti    * yi ) - Σ ti * Σ yi ) / n * Σi    - (Σ ti  

a = (550 * 30 – 10 * 1474) / 4 * 30 – 100 = 88

b = ( 4* 1474 – 10*550) / 4 * 30 – 100 = 19,8 

a =88     b = 19,8 

y1 = 88 + 19,8*1 = 107,8

y2 = 88 + 19,8*2 = 127,6

y3 = 88 + 19,8*3 = 147,4

y4 = 88 + 19,8*4 = 167,2 
 
 

Для определения  основной ошибки прогноза используется зависимость : 
 

st = √ Σ (y٭ – yt)² / n-1

st = 688,8/3 = 15,15 

Информация о работе Анализ данных как составляющая часть принятия решений