Основные определения курса «Распознавание Образов»

Автор работы: Пользователь скрыл имя, 13 Октября 2010 в 12:08, Не определен

Описание работы

Цели науки распознавания образов

Файлы: 1 файл

Основные определения курс3.doc

— 144.50 Кб (Скачать файл)

Допустим для  следующего образа

система выдала следующие варианты на первом уровне распознавания:

Ё-1    
Ж-0.2 К-0.5 С-0.3
И-1    
К-0.3 Х-0.7  
 

Из этих вариантов  можно составить следующие образы второго уровня (цифра внизу означает встречаемость данного слова) 

Е Е Е Е Е Е
К С Ж К С Ж
И И И И И И
К К К Х Х Х
0 0 0.0009 0 0 0.0001
 

Для удобства напишем  снизу все вероятностные составляющие решения первого уровня, и перемножим: 

Е Е Е Е Е Е
К С Ж К С Ж
И И И И И И
К К К Х Х Х
0 0 0.0009 0 0 0.0001
0.5 0.3 0.2 0.5 0.3 0.2
0.3 0.3 0.3 0.7 0.7 0.7
0 0 0.000054 0 0 0.000014
 
 

Отсюда видно, что система примет решение «ЕЖИК», не смотря на то, что максимальную вероятность  на первом уровне распознавания получило бы несуществующее сочетание «ЕКИХ», и более того, даже если рассматривать существующие комбинации «ЕЖИХ» и «ЕЖИК», комбинация «ЕЖИХ» имеет большую суммарную вероятность на первом уровне, тем не менее за большего счет встречаемости слова «ЕЖИК», выиграла именно эта «интуитивно угадываемая» комбинация букв.

 

ЗАДАЧИ. 

  1. Система распознает заглавные буквы латинского алфавита, предварительно выделяя из изображений  символов 10 числовых признаков. Для  обучения классификатора используется обучающая последовательность из 100 примеров каждой буквы. Найти количество параметров состояния классификатора (размерность вектора w) для методов
    1. построения эталона
    2. ближайшего соседа
    3. к-ближайших соседей для радиуса гиперсферы R = 10 
  2. Предложите минимально достаточный набор признаков, для решения задачи распознавания овощей – картофель, свекла, огурец, помидор. Напишите примеры (эталоны) векторов признаков для всех классов. Для каждого признака и каждого класса постройте грубо график одномерного распределения p(x|Ck) с указанием масштаба. Для оценки распределения можно считать, что оно нормальное. 
  3. При решении задачи распознавания объекта с вектором признаков х методом к-ближайших соседей (радиус гиперсферы = 24, число признаков 2, количество элементов обучающей последовательности 170), классификатор выдал для всех классов одинаковую оценку P(Ck|x). При этом в гиперсфере с центром в точке х всего содержится 17 элементов обучающей последовательности. Определить количество элементов алфавита. 
  4. Две машины были распознаны роботом по совпадающим признакам – форма колес, радиатора, бампера, а также форме и цвету всех остальных деталей кузова и салона и отнесены к одному классу машин. Однако человек счел один объект пригодной машиной, а другой абсолютно нет. Какой дополнительный признак анализировал человек и не анализировал робот? Дайте математическое объяснение обоим случаям, применяя гипотезу о схожести. 
  5. Человек, ведя машину, с высокой вероятностью распознаёт, попадает ли правое или левое переднее колесо его автомобиля в ямку на дороге или нет. Разумеется человек никогда с линейкой не меряет ширину свого автомобиля или ширину дороги, равно как и не может зрительно точно оценить абсолютные расстояния. Поставьте задачу распознавания (алфавит, признаки, обучающая последовательность). 
  6. Может ли персептрон безошибочно решать задачу распознавания поступления или не поступления студента в вуз по признакам балл по математике и балл по физике, если для них заданы «проходные значения»? Почему? Нарисуйте пространство признаков, разметьте на нем области классов, покажите на рисунке разделяющую поверхность персептрона, которая всегда правильно «поступала» хороших студентов, но при этом принимала бы иногда и непроходных. Покажите разделяющую поверхность персептрона, которая точно «отправляла» бы всех непроходных студентов, но при этом страдала бы и часть «проходных». 
  7. Для задачи 6 укажите два способа , которыми можно было бы регулировать настройку классификатора чтобы склонить его к большей или меньшей лояльности к студентам. Подсказка: см. априорная вероятность, риск. 
  8. Выведите формулу Байеса, приведите знаменатель к форме, содержащий только выражения p(x|Ck) и P(Ck), покажите вывод формулы Байеса для непрерывных распределений в одномерном случае. 
  9. Выведите статистическую интерпретацию метода к-ближайших соседей и ближайшего соседа. 
  10. Алфавит состоит из 2х классов А и Б. В обучающую выборку входит 5 элементов класса А. При этом для априорных вероятностей классов известно, что P(А) = 0.5 P(Б). Если соотношение объектов А и Б в обучающей выборке соответствует наблюдаемому в «жизни», то какого примерно количество элементов класса Б в обучающей последовательности.

Информация о работе Основные определения курса «Распознавание Образов»