Інтелектуальний аналіз даних

Автор работы: Пользователь скрыл имя, 17 Мая 2010 в 18:18, Не определен

Описание работы

Останнім часом для вирішення практичних завдань все частіше застосовуються методи інтелектуального аналізу даних (Data Mining). Інтелектуальний аналіз даних (англ. Data Mining) — виявлення прихованих закономірностей або взаємозв'язків між змінними у великих масивах необроблених даних. Підрозділяється на завдання класифікації, моделювання і прогнозування та інші.
Побудова моделі інтелектуального аналізу даних є складовою частиною масштабнішого процесу, який включає всі етапи, починаючи з визначення базової проблеми, яку модель вирішуватиме, до розгортання моделі в робочому середовищі.

Файлы: 1 файл

Диплом_весь[1]_исправить.doc

— 1.05 Мб (Скачать файл)

     Крок 1. Для створення структури інтелектуального аналізу, що містить вкладені таблиці, використовується інструкція CREATE MINING STRUCTURE (розширення інтелектуального аналізу даних). Код інструкції можна розбити на наступні частини:

  • привласнення структурі імені;
  • визначення ключового стовпця;
  • визначення стовпців інтелектуального аналізу даних;
  • визначення стовпців вкладених таблиць.

     На  рисунку  показана інструкція DMX на створення структури «Market Basket»

     

     Рисунок 5.1 – Створення структури

     

     Рисунок 5.2 – Структура інтелектуального аналізу 

     Крок 2. На наступному етапі необхідно додати нову модель інтелектуального аналізу до структури інтелектуального аналізу «Споживацька корзина», заснованої на алгоритмі взаємозв'язків Microsoft, і змінити значення за умовчанням для параметра MINIMUM_PROBABILTY на 0.2. Зміна цього параметра приведе до створення більшої кількості правил алгоритмом взаємозв'язків Microsoft.

     Інструкція ALTER MINING STRUCTURE (розширення інтелектуального аналізу даних) використовується для додавання до структури інтелектуального аналізу моделі інтелектуального аналізу, що містить вкладену таблицю. Код інструкції можна розбити таким чином:

  • визначення структури інтелектуального аналізу даних;
  • вказівка імені моделі інтелектуального аналізу;
  • визначення ключового стовпця;
  • визначення стовпців початкових даних і прогнозованих стовпців;
  • визначення стовпців вкладених таблиць;
  • ідентифікація алгоритму і змін параметра.
 
 

     На  рисунку показана інструкція DMX на додання моделі «Modified Assocation» до структури «Market Basket»:

     

     Рисунок 5.3 – Додання моделі до структури 

     Крок 3. На цьому занятті за допомогою інструкції INSERT INTO (розширення інтелектуального аналізу даних) і представлень vAssocSeqLineItems і vAssocSeqOrders із зразка бази даних AdventureWorksDW обробляються структури і моделі інтелектуального аналізу даних, створені Крок 1. Створення структури інтелектуального аналізу «Споживацька корзина» і Крок 2. Додавання моделей інтелектуального аналізу до структури інтелектуального аналізу «Споживацька корзина».

     Код інструкції можна розбити на наступні частини:

  • визначення структури інтелектуального аналізу даних;
  • список стовпців структури інтелектуального аналізу даних;
  • визначення повчальних даних за допомогою інструкції SHAPE.

     На  рисунку  показана інструкція DMX на обробку структури і моделі:

     

     Рисунок 5.4 – Обробка структури і моделі 

     Після перевантаження модель підключається  в Biseness Intelligence і виглядає таким чином:

     

     Рисунок 5.5 – Модель інтелектуального аналізу 

     Крок 4. На цьому етапі буде створено  прогноз, заснований на моделі інтелектуального аналізу даних, якій був доданий в структуру «Споживацька корзина».

     На  рисунку показаний приклад інструкції прогнозування, у якій задана кількість та перелік товарів, що знаходяться в корзині (Mountain Bottle Cage, Mountain Tire Tube, Mountain-2000) і здійснюється прогнозування товарів, що може бути придбана разом з ними.

     

     Рисунок 5.6 – Створення прогнозу 

     Результат візуалізації моделі має 2 вигляду: аналітичний (рисунок 5.7), «дерево» (рисунок 5.8).

     Розглядаючи аналітичний вигляд, ми можемо визначити  вірогідність попадання товару в корзину, якщо там вже є який-небудь товар.

     Наприклад: при покупці товару Touring Tire Tube з  вірогідністю 54,3% буде куплений товар Touring Tire. А при покупці Touring-1000 і Touring Tire Tube, товар Touring Tire буде преобретен з вірогідністю 100%.

Рисунок 5.7 – Аналітичний вигляд 

     При візуалізації моделі в вигляді «дерево» ми можемо проглянути взаємозв'язок товарів при покупці.

     Наприклад при покупці Mountain-500 буде куплений Sport-100. В зворотну сторону цей вислів не вірний.

Рисунок 5.8 – Вигляд «дерево»

     6 РЕАЛІЗАЦИЯ ІНТЕРФЕЙСУ КОРИСТУВАЧА ДЛЯ РОБОТИ З МОДЕЛЛЮ І ЙОГО ВЕРИФІКАЦІЯ 
 

     Програмний продукт є простим у використанні, тому з ним легко може працювати навіть малокваліфікований користувач. Для повноцінної роботи програми необхідно встановити на робочому комп'ютері платформу Visual Studio 2005 та MS SQL Server 2005.

     Для безпосереднього початку роботи із програмою необхідно запустити додаток «AdventureWorksIn». При запуску з'явиться головна форма програми:

         

     

         Рисунок 6.1 – Головна екрана форма 

     Крок 1. Після натискання кнопки «Работа с данными» відкривається вікно, в якому можливо проглянути інформацію про наявні замовлення:

     

         Рисунок 6.2 – Вікно замовлень

     або створити нове замовлення:

         

         Рисунок 6.3 – Вікно нового замовлення 

         Крок 2. Після натискання кнопки «Создание модели» відкривається вікно, в якому необхідно ввести назву нової структури, нової моделі і 2 параметри («Минимальная вероятность» та «Минимальная поддержка»), останні параметри стоять за умовчанням:

         

         Рисунок 6.4 – Створення моделі

     Потім натиснути кнопку «Сохранить параметры», після чого у базі будить створена модель з необхідними параметрами.

     Крок 3. Для того щоб вибрати необхідний нам товар, треба натиснути кнопку «Прогнозирование». У вікні, що з'явилося, вибираємо 3 товари, які нам потрібні і вводимо назву моделі. Потім натискаємо кнопку «Сохранить параметры». 

         

         Рисунок 6.5 – Вибір товарів 

         Після чого з'являється результат прогнозування, в якому показані товари, які найбільш часто продаються з товарами, вибраними раніше.

         

         Рисунок 6.6 – Результат прогнозування 
    7 ОХОРОНА ПРАЦІ
     
     

     7.1 Стисла характеристика об'єкта  дослідження з питань охорони праці

     Об’єктом  дослідження є офіс бухгалтерського  відділу ТОВ «ТБ - Молдавкабель», яке виконує основну діяльність:

     згідно  з кодом галузі за ЗКГНГ – 71130

     згідно  з кодом за КВЕД :

     51.70.0 – «Інші види оптової торгівлі» (23 клас проф. ризику)

     Основна робота зв'язана з розумовою працею, тому відповідно до гігієнічної класифікації праці - праця на даному робочому місці  відноситься до категорії 1б.

     Це  підприємство зареєстровано в Приморському відділу ФССНВВ і ПЗУ м. Одеса  та віднесено до 23 -го класу професійного ризику.

     Назначен  страховий тариф СТ 1,16% % від фонду  оплати праці. Фонд оплати праці за 2008 рік склав 5*12*3500=42000 тис. грн ;

     страховий внесок – 1,16*42000 /100 = 487,2 тис. грн.

     Середньосписочна  чисельність персоналу в еквіваленті повної зайнятості на кінець 2008 р. – 5 чоловік.

     Робітники основного виробництва –  3    чол.

     Робітники допоміжного виробництва –  1   чол.

     Фахівці і службовці –   1  чол.

     Служба  охорони праці на об’єкті відсутня.  Відповідно  до пп. НПАОП  0.00-4.35-04 “Типове положення про службу охорони праці” – функції служби охорони праці виконує  в порядку сумісництва (суміщення) особа с відповідної підготовкою.

     Наявність робіт підвищеної небезпеки згідно з переліком ДНАОП 0.00-8.02-93  –  відсутня.

     Наявність таких робіт, де необхідне проведення професійний відбір згідно з ДНАОП 0.03-8.06-94 – відсутня.

     Організація та проведення попередніх та періодичних  медичних оглядів згідно з ДНАОП 0.03-4.02-94

     Попередній  медичний огляд при пристрої на роботу на об’єкті проходили всі робітники організації. Періодичний медичний огляд відповідно до ДНАОП 0.03-4.02-94 проводиться 1 раз на  6 місяців, останні 1 раз в  2 роки.

     Відповідно  до пп. 5.1.“Типове положення про  порядок проведення навчання і перевірки  знань з питань охорони праці” виконується проведення попередніх та періодичних (1 раз у три році) навчань посадових осіб і спеціалістів з питань охорони праці. Постійно діючих комісій з перевірки знань немає. Мається протокол перевірки знань. Час останньої перевірки знань – 02.2008 року. Наступна перевірка – 02.2010(2009).

     За  весь період існування підприємства не було зареєстровано жодного нещасного випадку та професійного захворювання. Відповідно НПАОП 00.0-6.02-04 взято на облік:

     Акти            Знаходиться на обліку
     Акт  н/в Н-1      0
     Акт розслідування н/в Н-5      0
     Акт П-4      0
     Акт НПВ      0

     Планові перевірки службами Держгірпромнагляд, Державний санітарно-епідеміологічний нагляд МОЗ, Держпожнагляд МНС України – проводяться раз у три роки. За 2008 р.  була здійснена дві оперативна перевірка Держпожнаглядом ГУ МНС України в Одеській області  та Держгірпромнаглядом. 
 

 

      7.2  Виявлення і аналіз небезпечних і шкідливих виробничих чинників в даній робочій зоні 
 

      1. Аналіз  стану повітряного середовища
 

       Приміщення з ЕОМ обладнані  системами опалювання, кондиціонування повітря або приточування-витяжною вентиляцією відповідно до СНіП 2.04.05-91 "Опалювання, вентиляція і кондиціонування". Параметри мікроклімату, іонного складу повітря, зміст шкідливих речовин на робочих місцях, оснащених відеотерміналами, відповідають вимогам ДСН 3.3.6-042-99 «Державні санітарні норми мікроклімату виробничих приміщень».

     ГОСТ 12.1.005-88 "ССБТ. Загальні санітарно-гігієнічні вимоги до повітря робочої зони", СН 2152-80 "Санітарно-гігієнічні норми  допустимих рівнів іонізації повітря виробничих і суспільних приміщень".

     Для підтримки допустимих значень передбачені  установки  кондиціонування повітря.

     Таблиця 7.1 – Параметри мікроклімату для приміщень з ВДТ і ПЕВМ

Пору  року Категорія робіт  у відповідності з ГОСТ 12.1-005 Темп-ра повітря °С, оптим. Відносить. вогкість повітря %

оптимальна

Швидкість руху повітря, м/с, оптимальна Факт.

знач. темп. повітря. °С

 

Холодне легка - 1а 22–24 40–60 0,1 17–21
легка – 1б 21–23 40–60 0,1 17–21
Тепле легка - 1а 23–25 40–60 0,1 20–26
легка – 1б 22–24 40–60 0,2 20–26

Информация о работе Інтелектуальний аналіз даних