Автор работы: Пользователь скрыл имя, 10 Ноября 2010 в 15:56, Не определен
Формальная модель нейрона и нейросети
Если " ti
= 1, то имеем пространственно-временной
образ (ПВО), в этом случае однозначно определено,
по каким входам и в какие моменты времени
приходили сигналы. Примером может быть
распознавание музыкального тона определенной
высоты.
Элемент lw предназначен для набора статистики по данному пространственно-временному образу. Значение lw=1 указывает на то, что данный нейрон обучен.
Задержки Di и ti заданы изначально, т.е. являются константными параметрами нейрона. Если поступающая на данный нейрон последовательность сигналов содержит закономерность, описываемую такими временными параметрами, то нейрон сформирует образ такого пространственно-временного прообраза. Очевидно, что необходимое число нейронов такого типа в сети будет тем меньше, чем больше априорной информации о временных характеристиках прообразов известно на стадии синтеза сети.
Приведем формализм нейрона.
Owt+1 = cwt+1 & Swt+1 ;
cwt+1
= bwt+1
& lwt+1
;
bwt+1
=
yit
= ù
cwt
& ait
;
ait
=
;
где
= tï
xit = 1
- момент импульса на входе xi
;
lw
t =
;
Nw0 = 0;
Nwt = Nwt-1 + bwt ;
Rw(Nwt)
- убывающая сигмоидальная функция.
Процесс накопления знаний БЗ в рамках методологии ААУ подробно рассмотрен в [Диссер], [Жданов4-8]. В данном разделе мы опишем лишь основные отличия от указанных источников.
Рассмотрим
общий алгоритм формирования БЗ. Основная
цель алгоритма состоит в накоплении статистической
информации, помогающей установить связь
между выбранными управляющей системой
воздействиями на среду и реакцией среды
на эти воздействия. Другая задача алгоритма
состоит в приписывании оценок сформированным
образам и их корректировки в соответствии
с выходным сигналом блока оценки состояния.
Определение
4.1. Будем называть полным
отсоединением ФРО от
среды следующее условие: процессы
и
являются независимыми. Вообще говоря,
в действующей системе, конечно же эти
процессы зависимы, например, в простом
случае без блока датчиков
, но для введения некоторых понятий
требуется мысленно «отсоединить» входной
процесс и процесс
среды.
Определение 4.2. Назовем временем реакции среды на воздействие число , где случайные величины и являются зависимыми при полном отсоединении ФРО от среды. Закономерностью или реакцией среды будем считать зависимость от .
Заметим, что .
Введем совокупность образов
.
Параметр n > 0 назовем запасом на инертность среды. Смысл состоит в том, что если обучен, в текущий момент времени распознан образ и УС выберет воздействие то с некоторой вероятностью через n шагов распознается образ . Аналогично введем образ
,
смысл которого совпадает со смыслом , с тем лишь различием, что не распознается, а вытеснится. Поскольку в конечном итоге способом управления УС является вызов определенных образов и вытеснение других, то совокупность обученных образов является материалом, способствующим достижению цели управления, то есть вызову или вытеснению определенных образов посредством выбора воздействия из множества возможных воздействий Y на каждом шаге t. Как используется этот материал будет изложено в разделе «Блок принятия решений».
Запас на инертность введен из следующих соображений. Совершенно очевидно, что бесполезно пытаться уловить закономерность вида «был распознан образ , применили и через m шагов получили », где , так как среда будет просто не успевать отреагировать. Таким образом, УС может уловить закономерности со временем реакции среды не большим чем n. Аналогично, нет смысла выбирать n слишком большим, т.е. гораздо большим, чем . С другой стороны, используя синаптические задержки входных сигналов в нейроне, мы можем отловить любую закономерность со временем реакции меньшим либо равным запасу на инертность. Действительно, мы можем построить ФРО так, чтобы образы и формировались с нужными задержками , где m – время реакции среды. Заметим, что a priori нам неизвестно время реакции среды m, поэтому имеет смысл лишь выбрать параметр n для всех образов одинаковым и «наверняка» большим чем (для этого необходимо воспользоваться априорной информацией о среде).
Теперь сопоставим каждому образу из ФРО некоторое число или оценку. Пусть – выход блока оценки состояния, а – оценка образа , получающаяся по следующему алгоритму:
, ,
где – некоторая «усредняющая» функция, - множество моментов времени, в которые образ был распознан. В качестве обычно берется просто среднее арифметическое
.
Теперь
можно определить, что такое база знаний.
Определение
4.4. Назовем базой
знаний совокупность сформированных
образов
и совокупность оценок
для всех образов ФРО.
Определение 4.5. Обозначим объединение множеств всех образов (4.1) и (4.2) через , где F – множество образов ФРО, Y – множество возможных воздействий. Назовем B пространством образов БЗ.
Для моделирования на ЭВМ компонентов УС, сконструированных из нейронов, была осознана необходимость в специальном инструменте, позволяющем с помощью удобного графического интерфейса создавать библиотеки шаблонов блоков, строить сети из блоков, построенных по шаблонам, и просчитывать сеть с возможностью просмотра промежуточных состояний сети, сбора и анализа статистики о работе сети в целях отладки. При создании (или выборе) инструмента использовались следующие критерии:
Информация о работе Нейросетевая реализация системы автономного адаптивного управления