Лингвистический
аспект.
- Проблема
общего кода. Языки на которых говорят
инженер по знаниям и эксперт могут существенно
отличаться. Язык инженера по знаниям
состоит из 3ех компонентов: а) термины
предметной области, которые он взял из
специальной литературы в период подготовки
б) Общенаучная терминология из его теоретического
багажа в) Бытовой разговорный язык. А
язык эксперта состоит из 4ех компонентов:
а) Специальная терминология принятая
в предметной области б) Общенаучная терминология
в) Бытовой язык г) Профессиональный жаргон.
Если считать что бытовой и общенаучные
языки примерно совподают, то общий код
который необходимо выработать партнерам
буудет складываться из потоков: а) Бытовой
язык б) Спецтерминология эксперта в) Общенаучный
термин г) Спецтермины из литературы, причем
выроботка общего кода начинается с выписывания
инженера по знаниям всех терминов употребляемых
экспертом и уточнения их смысла, затем
следует группировка терминов и их синонимы.
- Понятийная
структура. Лингвистическая работа инженера
по знаниям на данном слое проблем заключается
в построении связанных фрагментов с помощью
сшивания терминов, таким обьразом для
разработки базы знания нужен не словарь,
а энцеклопедия в которой все термины
объяснены в словарных статьях со ссылками
на другие термины
- Словарь пользователя.
Лингвистические результаты соотнесенные
со слоями предыдущих проблем направлены
на создание адекватной базы знаний. Следовательно
для разработки пользовательского интерфейса
необходима дороботка пользовательского
словаря общего кода с поправкой на доступность
и прозрачность системы.
- Гносеологический
аспект. Гносеология это раздел философии
связаный с теорией познания или теории
отражения действительности в сознании
человека. В процессе извлечения знаний
инженера интересует компонент знаний
связанный с неканоническими, индивидуальными
знаниями эксперта, так как предметные
области именно с таким типом знаний считаются
наиболее восприимчивыми к внедрению
экспертных систем. Эти области называются
эмпирическими, так как в них накоплен
большой объем фактов и наблюдений, а их
теоритическое обобщение это вопрос будущего.
Рассмотрим этапы структуры познания:
1) Описание и обобщения фактов 2) Установление
связей и закономерностей(существует
2 вида мышления: 1) логическое 2) ассоциотивное
это цепочка идей связанных общими понятиями)
3) Построение идеализированной модели,
на этом этапе необходим специализированный
язык, с помощью которого можно описывать
и конструировать модели мира, которые
возникают в процессе мышления 4) Объяснение
и предсказание моделей это завершающий
этап структуры познаний, который является
частичным критерием истинности полученного
знания, и если выявленная система знаний
эксперта полна и объективна. То на её
основании можно делать прогнозы и объяснять
любые явления из данной предметной области.
Классификация
методов извлечения знаний.
### смотреть схему
в телефоне.
Д/з --- выписать
суть тринадцати методов.
###20/09/10###
«Нейросети»
1.
Так как особенностью ИИС является
способность решать слабо структурированные
или плохо формализованные задачи то традиционным
подходом к построению механизмов размышления
является использование дедуктивного
логического вывода на правило, которые
применяются в экспертных системах продукционного
и логического типа.
Кроме
традиционного существует альтернативный
подход, основанный на концепции обучения
по примерам. В этом случае не требуется
заранее знать об о всех закономерностях
исследуемой области, но необходимо располагать
достаточным количеством примеров для
настройки разрабатываемой адаптивной
системы, в качестве которых применяются
нейроные сети(искусственные). Искусственная
нейроная сеть это упрощенная модель биологического
мозга, точнее нервная ткань. Естественная
нервная клетка(нейрон) состоит из тела(сомы),
содержащего ядро и отростков — дендритов,
по которым в нейрон поступают сигналы.
Один из отростков служит для передачи
выходных сигналов данного нейрона другим
нервным клеткам, он называется аксоном,
соединение аксона с дендритом другого
нейрона называется синапсом.
Сеть
искусственных нейроных сетей представляет
собой совокупность простых вычислительных
элементов, искусственных нейронов, каждый
из которых обладает определенным количеством
входов и единственным выходом. Таким
образом модель искусственного нейрона
представляет собой дискретно непрерывный
преобразователь информации.
- Области решаемых
задач. Нейросетевой подход показал свою
эффективность как при решении плохо формализованных
задач распознавания, кластеризации, ассоциативного
поиска, так и при решении хорошо формализованных,
но трудоемких задач аппроксимации функции
многих переменных и оптимизационных
задач. Выделяют следующие задачи:
1) Распознавание
образов. Задача состоит в отнесении
входного набора данных, представляющего
распознаваемый объект, к одному
из заранее известных классов. Число
этих задач входит распознавание рукописных
и печатных символов, при оптическом вводе
в ЭВМ, распознавание типов клеток крови,
распознавание речи и другие.
2) Кластеризация
данных задача состоит в группировке
входных данных по присущей им «Близости».
Алгоритм определения близости данных(определения
расстояния между векторами и другие)
закладывается в нейросеть при её построении.
Наиболее известные применения кластеризации
связаны со сжатием данных, анализом данных
и поиском в них закономерности.
3) Ассоциотивная(контекстно
адресуемая) память, это память позволяет
считывать содержимое по частичному
или искаженному изображению,
заполненных данных, основная область
— мультимедийные базы данных.
4) Аппроксимация
функций. Имеется набор эксперементальных
данных {(x1, y1), …,(xn, yn)} представляющих значение
Yi неизвестной функции от аргумента Xi=(Xi1,
Xi2,..., Xim). Требуется найти функцию апроксимирующую
неизвестную и удовлетворяющую некоторым
критериям. Эта задача актуальна при моделировании
сложных систем и создании систем управления
сложными динамическими объектами.
5) Предсказание.
Говорит о том что набор
значений y представляющий собой
поведение системы в момент
времени t требуется по предыдущему
поведению системы предсказать
её поведение в момент временит. е. ###
Используется в системах управления складскими
запасами и всистемах принятия решений.
6) Оптимизация. Имеются ограничения и
оптимизирующие значения целевой функции,
требуется найти решение полной NP — проблемы
- Модель искусственного
нейрона. Любой нейрон задается совокупностью
его входа, весами входа, функцией состояния
и функцией активации. Функция состояния
определяет состояние нейрона в зависимости
от его входов, весов входа и предыдущих
состояний. Функция активации определяет
выходной сигнал нейрона как функцию от
его состояния.
Функции
активации могут быть:
- Линейная
y=kp+b
- ступенчатая
- сигмаидальная
- Модели нейроных
сетей. Теория искусственных нейросетей
в настоящий момент проходит этап формирования.
Исследователи наделяют искусственные
нейроны разнообразными свойствами, которые
адекватны функциям биологических нейронов
и позволяет получать решение задач актуальных
для исследователя, следовательно нейроная
сеть образуется путем объединения ориентированного
взвешенными весами выходов нейронов
с входами, при этом граф межнейронных
соединений может быть ациклическим либо
циклическим. Существует 3 типа нейроных
сетей:
1) Сеть с прямыми
связями.
2) Сеть с перекрестными
связями
3) Сеть с обратными
связями
Сети могут
быть:
- Конструируемыми
в которых число, тип нейронов, граф нейронов
и веса входов определяется при создании
сети. Функционирование таких сетей заключается
в следующем:
1) при подаче
на входе частичной или ошибочной
входной последовательности, сеть
через какое то время переходит
в одно из устойчивых состояний предусмотренных
при её конструировании.
2) При этом
на входах сети появляется
одна из запомненых последовательностей
признаваемая сетью как наиболее
близкая из начально поданных.
- Обучаемыми.
В которых графы межнейроных связей и
веса входов изменяются при выполнении
алгоритма обучения. Алгоритмы обучения
делятся на 3 группы:
1) Наблюдаемые,
когда значение выхода заранее
известно и обязательно сравнивается
с получившимся значением.
2) Ненаблюдаемые.
Выходных значений нет, но близкие входные
векторы группируются так чтобы они формировали
одни и тот же выход сети.
3) Смешанные.
Используется как наблюдаемые
и ненаблюдаемые алгоритмы.
Классы нейроных
сетей называют нейропарадигмами, которые
характеризуются:
1) Состовляющими
их нейронами(число входов, функция
состояния, функция активации
каждого нейрона или слоя нейрона)
2) Типом графа
межнейроной связи(с прямыми связями,
с перекрестными связями и
обратными)
3) Способом формирования
связей и весов связей(конструируемые,
наблюдаемо обучаемые, ненаблюдаемо обучаемые,
смешано обучаемые), таким образом эффективность
решения связи с применением нейросети
зависит от выбранной нейропарадигмы
и полноты примеров имеющихся в базе данных.
На основании этого выделяют следующие
виды сетей:
1) многослойные
сети в которых связи устанавливаются
только между нейронами соседних
слоев. Тогда структура нейросети
определяется правилом(число нейронов
в следующем слое в 2 раза
меньше чем в предыдущем)
2) Рекуррентные
сети. Содержит обратные связи что дает
получение различных значений выходов
при одних и тех же входных данных. В процессе
обучения позволяют накапливать знания.
3) Модель Хопфилда.
Эта математическая модель ассоциативной
памяти с использованием правила
Хэбба: если 2 нейрона возбуждаются вместе
то их сила связей возрастает, если они
возбуждаются порознь то сила связей между
ними уменьшается. Условия для построения
модели Хопфилда:
1) Все элементы
связаны со всеми
2) Прямые и
обратные связи симметричны
3) Исключаются обратные
связи с выхода на вход одного нейрона.
Развитие модели
Хопфилда является машина Больцмана, для
решения комбинаторных и оптимизационных
задач и задач искусственного
интелекта.
Самоорганизующиеся
сети Кохонена в которых применяются
специальные алгоритмы самообучения на
основе конкуренции между нейронами. Сети
Кохонена содержат один выходной слой
обрабатывающих элементов с пороговой
передаточной функцией. Число нейронов
в выходном слое соответствует колличеству
распозноваемых классов. В конкурентной
борьбе побеждает нейрон имеющий значение
весов наиболее близкие к нормализованному
вектору входных сигналов на практике
идея Кохонена используется в комбинации
с другими нейропарадигмами.
- Обучение
на примерах. Важнейшим свойством нейросетей
является их способность к обучению следовательно
нейросети незаменимы при решении задач
для которых алгоритмизация является
невозможной, проблематичной или слишком
трудоемкой. Парадигма обучения определяется
доступностью необходимой информации.
Выделяют 3 парадигмы:
1) Обучение с
учителем
2) Обучение без
учителя, неконтролируемое
3) Смешанное
обучение.
Обучение по
примерам характеризуется 3 основными
свойствами:
- Емкость,
которая соответствует количеству образцов
которые может запомнить сеть.
- Сложность
образцов которая определяет способности
нейросети к обучению
- Вычислительная
сложность.
Расмотрим известные
правила обучения:
- Правила коррекции
по ошибке. Весь процесс обучения состоит
в коррекции исходных данных которые обычно
задаются случайным образом. Разность
между известным значением результата
и реакцией сети соответствует величине
ошибки которая может использоваться
для корректировке. Коректировка заключается
обычно в небольшом(менее 1ого процента
увеличения веса тех связей которые усиливают
правильные реакции и улучшения тех связей
которые способствуют ошибочным)
- Правило Хэбба:
если нейроны по обе стороны синапса активизируются
одновременно то силой синаптической
связи возрастает
- Обучение
методам соревнований при которым нейроны
соревнуются друг с другом за активизацию
в процессе соревновательного обучения
осуществляется изменение весов связи
выйгравшего нейрона(победитель забирает
все)
- Метод обратного
распрастранения ошибки при котором необходимо
распологать обучающей выборкой содержащей
правильные ответы. То есть выборка должна
включать множество пар образцов входных
и выходных данных, между которыми необходимо
установить соответствие. Перед началом
обучения межнейроным связям присваиваются
небольшие нейроные значения. Каждый шаг
процедуры состоит из двух фаз: 1) Входные
элементы сети устанавливаются в заданное
состояние. Далее входные сигналы распространяются
по сети порождая некоторые выходной вектор.
2) Полученый выходной вектор сравнивается
с требуемым, если они совпадают, то весовые
коофиценты связей не изменяются, в противном
случае вычисляется разница между фактическими
и требуемыми выходными значениями, которая
передается от выходного слоя к входному.
На основе этой информации проводится
изменение связей. Обучение продолжается
до тех пор пока ошибка не уменьшится до
заданной величины