Автор работы: Пользователь скрыл имя, 02 Января 2011 в 14:22, реферат
Система предназначена для идентификации объекта, находящегося на переднем пассажирском сиденье легкового автомобиля. Необходимость такой системы идентификации обусловлена двумя причинами, во-первых, травмами, а иногда и смертельными случаями, которые имеют место при использовании подушек безопасности. Причем жертвами таких ситуаций чаще всего бывают дети. И, во-вторых, замена подушек безопасности процедура дорогостоящая и в случае отсутствия пассажира нет необходимости открывать подушки. Интеллектуальная система безопасности должна, исходя из результатов оптических наблюдений, скорректировать работу подушек безопасности.
ВВЕДЕНИЕ……………………………………………………………. 3
1 Интеллектуальные системы безопасности в автомобилях……… 4
2 Постановка задачи…………………………………………………. 4
3 Предварительная обработка данных……………………………... 7
4 Архитектура модульной нейронной сети и оценка полученных результатов………………………………………………………….
10
ЗАКЛЮЧЕНИЕ……………………………………………….……….. 13
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………………….
Уфимский государственный нефтяной технический университет
МАТЕМАТИЧЕСКОЕ
МОДЕЛИРОВАНИЕ
Реферат
на
тему
«Применение
нейронных сетей в
по дисциплине
«Нейроинформатика»
Выполнил студент гр. ЭМ-06-01 ____________ Мустафина А.Р.
(подпись, дата)
Уфа 2010
СОДЕРЖАНИЕ
ВВЕДЕНИЕ………………………………………………………… |
3 | |
1 | Интеллектуальные системы безопасности в автомобилях……… | 4 |
2 | Постановка задачи…………………………………………………. | 4 |
3 | Предварительная обработка данных……………………………... | 7 |
4 | Архитектура модульной
нейронной сети и оценка полученных результатов………………………………………………… |
10 |
ЗАКЛЮЧЕНИЕ……………………………………………….… |
13 | |
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ…………………. | 14 |
ВВЕДЕНИЕ
Одним
из важнейших направлений при создании
современного автомобиля является разработка
систем безопасности и, в частности, интеллектуальных
систем, которые позволяют гибко реагировать
на экстремальные ситуации. Одной из таких
систем является интеллектуальная система
управления открытием подушек безопасности.
Система предназначена для идентификации
объекта, находящегося на переднем пассажирском
сиденье легкового автомобиля. Необходимость
такой системы идентификации обусловлена
двумя причинами, во-первых, травмами,
а иногда и смертельными случаями, которые
имеют место при использовании подушек
безопасности. Причем жертвами таких ситуаций
чаще всего бывают дети. И, во-вторых, замена
подушек безопасности процедура дорогостоящая
и в случае отсутствия пассажира нет необходимости
открывать подушки. Интеллектуальная
система безопасности должна, исходя из
результатов оптических наблюдений, скорректировать
работу подушек безопасности.
1 Интеллектуальные системы безопасности в автомобилях
Любой сложный механизм, и автомобиль здесь не исключение, представляет для человека определенную опасность. А потому с самого начала производства различных самоходных телег изобретатели пытались сделать их как можно безопаснее для водителя, пассажиров и пешеходов. Сначала выдумывались несуразные законы о применении сигнальщиков, бегущих с флагами впереди автомобиля, потом же инженерная мысль взяла свое. Появилось упорядоченное дорожное движение, знаки и светофоры, сама конструкция автомобилей постоянно совершенствовалась во избежание возникновения аварийных ситуаций и для уменьшения трагических последствий.
Так современная безопасность автомобиля бывает пассивной и активной. Элементы пассивной безопасности встраиваются в саму конструкцию автомобиля и служат как раз таки для снижения тяжести последствий от аварии. Это усиленные элементы рамы и кузова, специальные зоны деформации на бамперах и в подкапотном пространстве, а также подушки и ремни безопасности. Активные же средства безопасности нацелены на то, чтобы предотвратить аварийно-опасную ситуацию, сравнимо с тем, что сейчас алкотестер купить, но ни в коем случае не ехать пьяным за рулем. К активным средствам причисляют оборудование, которое контролирует тяговые и сцепные свойства автомобиля, курсовую устойчивость и крены в поворотах, а также торможение.
2 Постановка задачи
Существует множество стандартных библиотек для работы с графическими изображениями. Однако для решения поставленной задачи большинство из них не применимы из-за ряда технических аспектов, таких как низкая разрешающая способность используемых видеокамер, использование широкоугольных объективов со значительной дисторсией, наличие помех в виде существенных перепадов яркости по полю изображения, требования высокого быстродействия. Дополнительным условием является то, что разрабатываемая система должна быть легко адаптируема под любую марку автомобиля. При изменении марки автомобиля, как правило, меняется не только форма салона, но и расположение камеры внутри салона. Наиболее перспективным решением представляется использование нейронных сетей, которые как раз и предназначены для решения сложных задач распознавания. При этом для адаптации разработанной системы под новый автомобиль достаточно собрать данные в новых условиях и переобучить нейронную сеть. Структура системы и алгоритмы ее функционирования останутся неизменными.
По снимку с видеокамеры, находящейся в салоне автомобиля, необходимо классифицировать тип объекта, находящегося на пассажирском сиденье рядом с водителем. Возможные варианты классификации приведены в табл.1.
Таблица 1 — Типы пассажиров
|
При сборе данных для класса «взрослый человек» приглашались люди разного роста, веса и пола, которые могли занимать произвольные позы, вплоть до частичной или полной блокировки камеры. Снимки «пустого сидения» содержали как полностью пустое сидение, так и сидение с некоторым количеством предметов на нем. В качестве пассажира «детского сидения» использовались куклы соответствующего размера.
Видеокамера оборудована широкоугольным объективом с углом обзора 90о и инфракрасным фильтром. Применение широкоугольного объектива обусловлено малым расстоянием до объекта классификации. Для возможности работы системы при отсутствии внешних источников света в состав системы входят диоды инфракрасной подсветки. Размер получаемого изображения 320x240 пикселов. Примеры снимков для разных классов представлены на рис.1. Конечным результатом должна стать программа на языке «C», которая впоследствии будет адаптирована для выполнения на контроллере, находящемся в автомобиле.
Рисунок 1 — Примеры снимков: вверху —взрослый пассажир, внизу слева — пустое сидение, внизу справа — детское сидение
Объем
обучающей выборки насчитывал 135500 снимков,
объем тестовой выборки равнялся 55000 снимков.
Сбор данных происходил в условиях слабой
интенсивности внешних источников света,
что несколько снижает репрезентативность
полученных выборок. Для придания системе
устойчивости к неточной установке камеры
с исходного набора был сгенерирован аналогичный
набор данных со случайным смещением картинки
в произвольном направлении на расстояние
до 5 пикселов, таким образом общее число
векторов в обучающей и тестовой последовательности
удвоилось.
3 Предварительная обработка данных
Самым неформализованным этапом применения нейронных сетей для решения прикладных задач, является предварительная обработка данных. Иногда предварительной обработки можно избежать или свести ее к минимуму, но при работе с изображениями она играет немаловажную роль.
Учитывая требования к высокой скорости распознавания, алгоритм предварительной обработки не должен требовать больших вычислительных затрат. Поэтому был применен один из простейших алгоритмов выделения контуров, а в качестве признаков использовались локальные градиенты освещенности, средние уровни освещенности на участках изображения и гистограммы расстояний от края изображения до выделенных контуров.
Обработка изображения проводилась путем выделения локальных признаков. Для этого использовалась стандартная техника скользящего окна. Все изображение разбивалось на окна размером 40х40 пикселов в каждом, из которых находились максимальные градиенты яркости в двух направлениях: горизонтальном и вертикальном. При этом найденные величины градиентов сравнивались с пороговым значением. Если максимальный градиент по абсолютной величине не превышает порога, то считаем, что в данном окне градиент вдоль этого направления отсутствует.
С учетом знака градиента для каждого окна получаем 4 признака, соответственно, с учетом количества окон на изображении (48, если окна не пересекаются), для градиентов освещенности на изображении получаем 192 признака. Поскольку большинство парадигм нейронных сетей наиболее успешно работают для данных, лежащих в диапазонах [-1;1] либо [0;1], полученный вектор признаков нормировался в данный диапазон [0;1]. При нормировке для каждого вектора находился свой коэффициент масштабирования. Следует отметить, что простейшая нормировка с использованием фиксированного коэффициента для всех векторов в выборке иногда дает лучшие результаты. Однако нормировка внутри одного вектора более устойчива к перепадам внешней освещенности салона автомобиля.
Средний уровень освещенности рассчитывался для тех же самых 48 окон. Признак средней освещенности предназначен для выделения объектов изображения, которые не имеют четких границ, то есть не дают значений градиентов, превышающих выбранное пороговое значение.
На рассматриваемом массиве данных, при использовании в качестве признаков только градиентов, можно получить качество распознавания на уровне 99,5–99,7% правильных ответов. Однако на практике при использовании в качестве признаков только контуров система оказывается не устойчива к смещению камеры относительно позиции, в которой набиралась обучающая выборка. Для исправления данного недостатка были использованы дополнительные признаки. Одним из таких признаков были гистограммы расстояний от края окна до границы. Гистограммы дают более интегрированное описание изображения.
Третьей группой признаков, использовавшихся для формирования входного вектора нейронной сети, являются гистограммы контуров. Для получения гистограмм контуров проводилась бинаризация исходного изображения. Для ускорения предварительной обработки изображений бинаризация проводилась внутри ранее использованных окон.
Процедура бинаризации включает в себя поиск максимального градиента внутри каждой строки и каждого столбца окна. Если максимальный градиент превышает порог, то соответствующему пикселу на бинарном изображении присваивается значение единица. Все остальные пикселы остаются нулевыми. Таким образом, максимально возможное количество единичных пикселов для каждого окна составляет сумму количества строк и столбцов в окне. На практике количество единичных пикселов в окне обычно не превышает половины этой суммы. Поскольку для бинаризации используются максимальные градиенты в каждой строке и столбце, то на бинарном изображении получаем линии, соответствующие наиболее характерным контурам объектов. Пример получаемого бинарного изображения представлен на рис.2.
На основе бинарного изображения строились гистограммы расстояний контуров от края рисунка. Измерялись расстояния до единичных пикселов в каждой строке и каждом столбце. Гистограммы строились для вертикальных и горизонтальных полос, то есть каждый элемент гистограммы содержит сумму единичных пикселов, попадающих в заданный диапазон расстояний и лежащих внутри полосы. Ширина полосы выбиралась равной размеру используемых окон. Такой выбор обусловлен исключительно соображениями быстродействия алгоритма.