Cоздание моделей свойств двухслойных пленочных структур на основе линейно-цепочечного углерода с помощью Data Mining

Автор работы: Пользователь скрыл имя, 29 Сентября 2011 в 16:28, дипломная работа

Описание работы

Целью данной работы является создание вычислительных моделей по свойствам продуктов нанотехнологий. В частности, объектом исследований мы выбрали линейно-цепочечный углерод.

В задачи работы входили:

- Аналитический обзор возможностей методов интеллектуального анализа данных.

-Сбор данных по электрическим свойствам нанопленок ЛЦУ, подготовка баз данных.

- Создание моделей свойств нанопленок с помощью искусственных нейронных сетей, позволяющих прогнозировать их свойства в зависимости от различных параметров.

Содержание работы

Введение……………………………………………………………………….…3

Глава 1 Литературный обзор

1.1. Что такое Data Mining ……………………….………………...……….....4

1.2. Методы и стадии Data Mining……………………………………………...5
1.3. Классификация задач Data Mining………………………………………...8
1.4. Модели Data Mining………………………………………………………..11

1.5. Теория нейронных сетей………………………………………………….14

1.6.Классификация нейронных сетей…………………………………………18

1. 7.Подготовка данных для обучения ……………..…………………………20

1.8. Выбор структуры нейронной сети……………………………………….21

1.9. кратко о ЛЦУ…………………………………………………………….22

Глава 2. Методика исследования и результаты работы

2.1. Вычислительная модель электрических пленок ЛЦУ……………….…25

2.2. Предобработка данных………………………………………………..…26

2.4. Структура и обучение нейронной сети…………...……………………...36

2.5. Анализ качества обучения нейронной сети………………………………42

2.6. Проверка и оценка моделей……………...……………………………….45

Заключение…………………………………………………………………..…49

Список использованных источников …………………………………….......50

Приложение № 1………………………………………………………………52

Файлы: 1 файл

1 диплом-2003.doc

— 998.50 Кб (Скачать файл)

          1)  Применение возможно в случае  наличия достаточного количества случаев для изучения

          2)  Второе ограничение вытекает  из гипотезы корреляционного  анализа, в которую заложена  линейная зависимость переменных. Во многих случаях, когда достоверно известно, что зависимость существует, корреляционный анализ может не дать результатов просто ввиду того, что зависимость не линейна

          3)  Поле имеет числовой тип  данных

     В выходной набор попадут информационные поля, столбцы, удовлетворяющие этим условиям, и все выходные столбцы. 

     

     Рис 8. Матрица корреляции

          Можно сделать вывод, что больше  всего с выходным значением  коррелирует фактор «напряжение» - коэф.=0,494.  Коэффициент положителен, т.е. чем больше напряжение, тем больше сила тока. Самый меньший коэффициент =-0,210(номер второго элемента ). Коэффициент отрицательный , т.е с увеличением номера второго элемента уменьшается сила тока.

           Предобработка данных является важнейшим этапом аналитического процесса, и ее элементы выполняются на всех его шагах, начиная от OLTP-систем и заканчивая аналитическим приложением. 
 

     2.3. Структура и обучение нейронной  сети

          

       Выбор структуры нейронной сети обуславливается спецификой и сложностью решаемой задачи. Для решения некоторых типов задач разработаны оптимальные конфигурации .

           В большинстве случаев выбор структуры нейронной сети определяется на основе объединения опыта и интуиции разработчика.

             Можно выделить две базовые архитектуры - слоистые и полносвязные сети.

          Слоистые нейронные сети - нейронные сети, в которых нейроны разбиты на отдельные группы (слои) так, что обработка информации осуществляется послойно. В слоистых сетях нейроны i-го слоя получают входные сигналы, преобразуют их и через точки ветвления передают нейронам (i+1) слоя. И так до k-го слоя, который выдает выходные сигналы для интерпретатора и пользователя. Число нейронов в каждом слое не связано с количеством нейронов в других слоях, может быть произвольным. В рамках одного слоя данные обрабатываются параллельно, а в масштабах всей сети обработка ведется последовательно - от слоя к слою.

          Слоистые сети, в свою очередь, могут быть однослойными и многослойными. Для решения многих задач аппроксимации достаточно одного слоя нейронов.

         Таким образом различные наборы значений номера элемента, группы элемента, толщины пленки ЛЦУ, напряжение  (каждая строка таблицы 1) размещались на входном слое ИНС. Соответствующие значения  силы тока хранились на выходном слое ИНС. В общей сложности ИНС состоит из одного входного слоя (шесть нейронов входа), один скрытый слой (десять нейронов) и один выходной слой (один нейрон).

     Перед использованием нейронной сети ее необходимо обучить.

     Процесс обучения нейронной сети заключается  в подстройке ее внутренних параметров под конкретную задачу. Алгоритм работы нейронной сети является интерактивным, его шаги называют эпохами или циклами. Процесс обучения осуществляется на обучающей выборке. Обучающая выборка включает входные значения и соответствующие им выходные значения набора данных. В ходе обучения нейронная сеть находит некие зависимости выходных полей от входных.

     В процессе обучения необходимо определить количество скрытых слоев и число  нейронов в каждом слое. Далее необходимо назначить такие значения весов  и смещений, которые смогут минимизировать ошибку решения. Веса и смещения автоматически настраиваются таким образом, чтобы минимизировать разность между желаемым и полученным на выходе сигналами, которая называется ошибка обучения. От качества обучения нейронной сети зависит ее способность решать поставленные перед ней задачи.

     Задачей моделирования в нашем случае является задача аппроксимации 6-мерной экспериментальной функции. Затем была выбрана соответствующая собранной базе данных архитектура ИНС (рис. 5) и проведено ее «обучение». Обучение заключалось в том, что различные наборы значений первых шести столбцов Таблицы 1 подавались на входной слой ИНС, а соответствующие значения силы тока устанавливались в выходном слое ИНС и с помощью известного метода обучения ИНС – метода «обратного распространения ошибки»  создавалась вычислительная ИНС-модель вольтамперной характеристики .

     Рис 9. структура нейронной сети 

     ИНС-модель

               В данной работе представлены результаты и  описание создания модели  “Обобщенная модель Вольт-амперной  характеристики ЛЦУ”. Данная модель позволяет предсказывать вольт-амперную характеристику любого нового сорта ЛЦУ.

            Схема построения модели была следующая. Были собраны данные по вольтамперным характеристикам исследуемых пленок ЛЦУ, отличающихся сортом внедренных в пленку атомов и толщиной пленки. Затем была подобрана соответствующая величине собранной базе данных архитектура ИНС и проведено ее «обучение». После обучения создавалась вычислительная ИНС-модель вольт-амперной характеристики пленок ЛЦУ.

            Задачей моделирования в данном случае является задача аппроксимации 4-мерной экспериментальной функции. Полученный «чёрный ящик» может использоваться для определения (прогнозирования) вольт-амперной характеристики ЛЦУ для различных комбинаций внедренных в ЛЦУ элементов периодической таблицы Менделеева без проведения экспериментов следующим образом. Номера и группы элементов, толщина пленки ЛЦУ и одно интересующее значение напряжения устанавливаются во входном слое ИНС. После этого «черный ящик» мгновенно вычисляет соответствующее этому набору данных значение тока, а также непосредственно всю вольт-амперную характеристику.

         Примеры полученных результатов представлены на следующих рисунках:

       

     Рис 10. Аппроксимация вольт-амперной характеристики ЛЦУ с внедренными в нее атомами кадмия при толщине пленки 2000 нм. 

     Рис 11. Прогнозируемая вольт-амперная характеристика пленки ЛЦУ с внедренными в нее атомами стронция при толщине

     пленки 2000 нм. 

     Как мы видим существует разница в  рисунках 1 и 2. Это различие свидетельствует о зависимости тока насыщения от вида внедренного элемента.

         Анализ по этому методу позволяет  исследовать, как будет вести  себя построенная система обработки при подаче на ее вход тех или иных данных. Проще говоря, проводится эксперимент, в котором, изменяя значения входных полей (в данном случае меняем значения ”номер элемента” и  “номер группы”)  обучающей или рабочей выборки нейронной сети или дерева решений, наблюдаем за изменением значений на выходе( силы тока).

        Так же обрабатывая таблицу с разными элементами возможно построение зависимости силы тока от внедренного элемента.

     Рис 12. Визуальное отображение зависимости  силы тока  от номера  внедренного  элемента 

     Рис 13. Визуальное отображение зависимости силы тока  от группы внедренного элемента 
 

     Иллюстрации приведенные выше показывают, что  созданная модель ИНС  позволяет  вычислить значение силы тока для  любой комбинации внедряемых элементов  и представление зависимости силы тока от какого-либо параметра. А так же прогнозирование вольт-амперной характеристики для раннее не исследованной комбинации внедренных элементов. 

     2.4. Анализ качества обучения нейронной сети 

          От качества обучения нейронной сети зависит ее способность решать поставленные перед ней задачи. Визуализатор для оценивания точности работы нейронных моделей представляет собой график, на котором по горизонтальной оси откалываются целевые значения обучающих примеров, а по вертикальной – значения, оцененные моделью. Тогда каждая пара целевого Y и оцененного Y’ значений может быть представлена на диаграмме в виде точки.

         Множество точек, для которых оцененное значение будет равно реальному, образует так называемую линию идеальных значений, для каждой точки которой выполняется равенство Y=Y’. Остальные точки, образованные примерами, на которых модель допустила ошибку, будут рассеяны вдоль линии. По степени их рассеяния можно оценить точность модели. Если большая их часть расположена достаточно близко к линии, а значительные отклонения редки или совсем отсутствуют, то модель работает хорошо.

 

     Рис 16. Диаграмма рассеяния действительных значений и значений, рассчитанных по уравнению регрессии. 

     Если  разброс точек велик, то ее точность низкая.

     Рис 17. Диаграмма рассеяния до предобработки  данных 

     На  практике при визуализации диаграммы  обычно строят две линии, соответствующие  допустимому уровню ошибки E = Y - Y’ (пунктирные линии на рисунке). Если большая часть точек лежит в пределах установленного ими «коридора», то можно утверждать, что модель работает хорошо. Если точки имеют значительный разброс и большая их часть расположена вне «коридора», то точность модели низкая .  Допустимая ошибка определяется аналитиком исходя из особенностей решаемой задачи.

          

     При обучении нейронных сетей часто  возникает серьезная трудность, называемая проблемой переобучения. Переобучение, или чрезмерно близкая подгонка - излишне точное соответствие нейронной сети конкретному набору обучающих примеров, при котором сеть теряет способность к обобщению.

     Переобучение  возникает в случае слишком долгого обучения, недостаточного числа обучающих примеров или переусложненной структуры нейронной сети. Переобучение связано с тем, что выбор обучающего (тренировочного) множества является случайным. С первых шагов обучения происходит уменьшение ошибки. На последующих шагах с целью уменьшения ошибки (целевой функции) параметры подстраиваются под особенности обучающего множества. Однако при этом происходит

     "подстройка" не под общие закономерности  ряда, а под особенности его  части -обучающего подмножества. При этом точность прогноза уменьшается.

     В этом случае выдаваемые результаты из обученной нейросети не будут являться правдивыми.

     Рис 18. Пример переобучения нейросети 

     Один  из вариантов борьбы с переобучением  сети - правильный выбор архитектуры нейронной сети и количества нейронов в скрытых слоях. 

                         2.5.  Проверка и оценка моделей

    

         Проверка модели подразумевает проверку ее достоверности или адекватности. Эта проверка заключается в определении степени соответствия модели реальности. Адекватность модели проверяется путем тестирования.

Адекватность  модели - соответствие модели моделируемому  объекту

или процессу. Понятия достоверности и адекватности являются условными, поскольку мы не можем рассчитывать на полное соответствие модели реальному объекту, иначе это был бы сам объект, а не модель. Поэтому в процессе моделирования следует учитывать адекватность не модели вообще, а именно тех ее свойств, которые являются существенными с точки зрения проводимого исследования.

     Оценка модели подразумевает  проверку ее правильности. Оценка  построенной модели осуществляется путем ее тестирования. Тестирование модели заключается в "прогонке" построенной модели, заполненной данными, с целью определения ее характеристик, а также в проверке ее работоспособности. Тестирование модели включает в себя проведение множества экспериментов. На вход модели могут подаваться выборки различного объема. С точки зрения статистики, точность модели увеличивается с увеличением количества исследуемых данных. Алгоритмы, являющиеся основой для построения моделей на сверхбольших базах данных, должны обладать свойством масштабирования.

Информация о работе Cоздание моделей свойств двухслойных пленочных структур на основе линейно-цепочечного углерода с помощью Data Mining