Классификация систем распознавания
3.1
Принципы классификации и типы систем распознавания
При рассмотрении задач, решаемых в процессе создания систем распознавания (тема 2) , мы говорили о признаках объектов (явлений), о способах их получения в процессе работы СР, об использовании априорной информации, не затрагивая вопросов взаимосвязей в системе. Иногда только упоминали об этом .
В то же время, чтобы легче, сознательнее решать задачу выбора признаков (а это, как мы помним, - процесс эвристический), а также для планирования использования как априорной информации (описание классов), так и апостериорных данных (измерения по данному неизвестному подлежащему классификации объекту) эти взаимосвязи необходимо хорошо представлять.
Однако, как оказывается, упоминаемые взаимосвязи могут принимать различные формы, иметь свои особенности. Простое перечисление здесь не подходит. Поэтому представляется необходимым классифицировать сначала сами системы распознавания. Это позволит понять взаимосвязи в них и решать те задачи, о которых мы сейчас говорили.
Начнем с уточнения того, что такое классификация. Классификация - это распределение предметов, явлений по классам, отделам, разрядам в зависимости от их общих свойств.
В основе классификации лежат определенные принципы.
Для классификации СР будем использовать следующие принципы:
1.Однородность информации для описания распознаваемых объектов или явлений.
2.Способ получения апостериорной информации.
3.Количество первоначальной априорной информации.
4.Характер информации о признаках распознавания.
А. Рассмотрим 1-й принцип.
(Однородность информации)
Здесь под однородностью следует понимать - различную или единую физическую природу информации (признаков).
По этому принципу СР делятся на:
-простые;
-сложные.
Простые СР характеризуются единой физической природой признаков. Например:
1) только масса - для систем распознавания жетонов, монет в автоматах таких, как междугородный телефон, турникет метро;
2) геометрические размеры - для таких СР, как всякого рода замки.
Ясно, что для простых систем распознавания не обязательно иметь компьютер. Достаточно их реализовать в виде механических или электромеханических устройств. Хотя компьютерные реализации в принципе не противопоказаны, если наряду с этой в системе решаются и другие более достойные задачи.
Сложные СР характеризуются физической неоднородностью признаков.
В рассмотренном нами в теме № 2 перечне признаков самолетов такая неоднородность просматривается невооруженным глазом. Там имели:
-и численность экипажей;
-и высоты полета;
-и взлетный вес;
-и геометрические размеры и т.д.
Точно также в медицинской практике для диагностики может оказаться необходимым привлекать:
-и температуру;
-и данные анализа крови;
-и данные кровяного давления;
-и кардиограммы и т.п.
Конечно, простота всегда предпочтительнее. Хорошо иметь всего 1 - 2 признака и при этом желательно однородных, чтобы решать задачу компьютерного распознавания, например, заболеваний печени. Но не всегда, как и в этом случае, так получается. Сравните распознавания ключа замком и распознавание преступника по словесному портрету (набору признаков).
Б. Второй принцип классификации СР.
(Способ получения апостериорной информации).
По этому принципу сложные системы ( а мы уже знаем, что они собой представляют) распознавания делятся на:
-одноуровневые;
-многоуровневые.
На рис. 1 изображена одноуровневая система распознавания.
Здесь:
И1, И2, .,Иn - разнородные по физической природе измерители.
АО - априорное описание классов распознаваемых объектов;
АК - алгоритм классификации;
САУ- система автоматического управления (алгоритм) распознаванием.
Многоуровневые сложные системы распознавания отличаются от одноуровневых тем, что не все признаки от разнородных физических измерителей используются непосредственно для решения задачи распознавания.
Здесь на основе объединения признаков нескольких измерителей и соответствующей обработки могут быть получены вторичные признаки, которые могут как использоваться в АК, так и сами в свою очередь служить основой для объединения. То есть, получаем 2-й, 3-й и др. уровни признаков, определяющие многоуровневость СР. Причем подсистемы, которые осуществляют объединение признаков, в свою очередь могут представлять собой также устройства распознавания (локальные СР).
Схема здесь в целом подобна предыдущей (для одноуровневой системы), а отличается лишь усложнением связей от признаков к АК.(Рис.2)
W
И 1 И 2 . И n
X11 X12 X1k X21 X22 X2p Xn1 Xn2 Xnr
A K
С А У
Решение о принадлежности
A O
Рис. 1
W
И 1 И 2 . И n
X11 X12 X1k X21 X22 X2p Xn1 Xn2 . Xnr
A B C
D
А К
С А У
А О Решение о принадлежности
Рис. 2
Таким образом:
в одноуровневых СР информация о признаках распознаваемого объекта (апостериорная информация) формируется непосредственно на основе обработки прямых измерений;
в многоуровневых СР информация о признаках формируется на основе косвенных измерений как результат функционирования вспомогательных распознающих устройств (пример: измерение дальности радиолокатором по времени задержки излученного импульса).
В. Третий принцип классификации.
(Количество первоначальной априорной информации).
Здесь вопрос касается того, достаточно или недостаточно априорной информации для определения априорного алфавита классов, построения априорного словаря признаков и описания каждого класса на языке этих признаков в результате непосредственной обработки исходных данных.
Соответственно этому СР делятся на:
-системы без обучения;
-обучающиеся (ОСР) и самообучающиеся системы (ССР).
Сразу заметим, что многоуровневые сложные СР однозначно нельзя разделить на указанные классы, так как каждая из локальных СР, входящих в их состав, сама может представлять как систему без обучения, так и систему обучающуюся или самообучающуюся.
Системы без обучения.
Для построения таких систем необходимо располагать полной первоначальной априорной информацией. Предыдущие, рассмотренные нами схемы СР фактически изображали такие системы.
Обучающиеся системы.
Итак, судя по предыдущему рассмотрению, для обучающихся систем мы должны иметь дело с ситуацией, когда априорной информации не хватает для описания распознаваемых классов на языке признаков . (Возможны случаи, когда информации хватает, однако делать упомянутое описание нецелесообразно или трудно).
Исходная информация для обучающихся СР (ОСР) представляется в виде набора объектов w1, w2, ,wl ,распределенных по m классам:
(w1 ,w2 , .,wr ) W1
(w r+1 ,w r+2 , .,wq ) W2
(wg+1 ,wg+2 , .,wl ) Wm
Цель обучения и ее достижение заключаются для ОСР в определении разделяющих функций
Fi(X1 ,X2 , .,Xn),
где i = 1,2, ,m (номер класса).
Определение этой функции осуществляется путем многократного предъявления системе указанных объектов (из набора w1,w2, ,wl ) с указанием, какому классу они принадлежат.
То есть, на стадии формирования ОСР работают с “учителем”, осуществляющим указание о принадлежности предъявленного для обучения объекта. И прежде, чем система будет применяться, должен пройти этап обучения.
О разделяющих функциях мы уже вели речь, когда рассматривали задачи построения систем распознавания. Теперь мы вернулись к этому понятию, определив СР, в которых указанные функции применяются.
Мы и еще раз вернемся к этому понятию, когда будем рассматривать математическую сторону вопроса определения разделяющей функции.
Теперь же мы уже в состоянии изобразить ОСР (Рис. 3).
Y - учитель;
ОО - обучающие объекты;
АРФ - алгоритм построения разделяющих функций;
ТС - под общим названием “Технические средства”
объединены измерители признаков распознавания;
АО - априорное описание классов распознаваемых об’ектов;
АК - алгоритм классификации;
САУ - система автоматического управления (алгоритм) распознавания;
w - неизвестные, распознаваемые объекты.
Пунктирные линии на рисунке соответствуют взаимосвязям в процессе обучения.
W
Т С ОБО У
А Р Ф
А О
С А У
А К
Решение о принадлежности
Рис. 3
3.2
Принципы классификации и типы систем распознавания
(Продолжение)
Самообучающиеся системы.
В отличии от систем без обучения и систем, обучающихся с учителем, для самообучающихся систем характерна недостаточность информации для формирования не только описаний классов, но даже алфавита классов. То есть, определен только словарь признаков распознавания. Однако для организации процесса обучения задается все-таки некоторый набор правил, в соответствии с которым система сама вырабатывает классификацию.
Для ССР также, как для ОСР существует период обучения, характерно наличие периода самообучения, когда ей предъявляются объекты обучающей последовательности. Только при этом не указывается принадлежность их к каким-либо классам.
Соответствующая функциональная схема ССР приведена на рис.4.
Здесь дополнительно к обозначениям рис.2,3 имеем:
ОС - объекты самообучения;
ПК - правила классификации;
АФК - алгоритм формирования классов.
Примером самообучающейся системы может быть система разделения на классы промышленных предприятий для сравнительного анализа эффективности их функционирования. При этом в качестве правил классификации могут быть указания либо о равенстве объемов выпускаемой продукции, либо о равенстве численности рабочих и т.п.).
В другой широко применяемой терминологии ССР - это система автоматического кластерного анализа или таксономии (taxis - порядок, nomos - закон).
Завершая рассмотрение классификации СР по количеству первоначальной априорной информации, заметим, что СР, в которых недостаточно информации для назначения словаря признаков, не существует. Без этого не создается никакая система.
W
Т С ОБС
А Ф К П К
А О
С А У
А К
Решение о принадлЕЖнОсти
Рис. 4
Г. Четвертый принцип классификации.
(Характер информации о признаках распознавания).
С характеристикой информации о признаках распознавания мы уже имели дело при изучении задач создания СР. В соответствии с ее отличительными особенностями СР подразделяются на
-детерминированные;
-вероятностные;
-логические;
-структурные (лингвистические);
-комбинированные.
Подытоживая пройденное, отметим характерные особенности этих систем, а именно: метод решения задачи распознавания и метод априорного описания классов.
Детерминированные системы.
а) Метод решения задачи распознавания: использование геометрических мер близости;
б) Метод априорного описания классов: координаты векторов-эталонов по каждому из классов или координаты всех объектов, принадлежащих классам (наборы эталонов по каждому классу).
Вероятностные системы.
а) Метод решения задачи распознавания: вероятностный, основанный на вероятностной мере близости (средний риск);
б) Метод априорного описания классов: вероятностные зависимости между признаками и классами.
Логические системы.
а) Метод решения задачи распознавания: логический, основанный на дискретном анализе и исчислении высказываний;
б) Метод априорного описания классов: логические связи, выражаемые через систему булевых уравнений, где признаки - переменные, классы - неизвестные величины.
Структурные (лингвистические) системы.
а) Метод решения задачи распознавания: грамматический разбор предложения, описывающего объект на языке непроизводных структурных элементов с целью определения его правильности.
б) Метод априорного описания классов: подмножества предложений, описывающих объекты каждого класса.
Комбинированные системы.
а) Метод решения задачи распознавания: специальные методы вычисления оценок;
б) Метод априорного описания классов: табличный, предполагающий использование таблиц, содержащих классифицированные объекты и их признаки (детерминированные, вероятностные, логические).
Комбинированные системы требуют отдельного рассмотрения для понимания принципов их построения, что мы и сделаем в нашем курсе после определенной подготовки.
В целом рассмотренная классификация СР может быть представлена следующей схемой (рис.5)
После проведенной классификации возвратимся для дополнительного рассмотрения функциональных схем СР. И обратим внимание именно на термин "достаточное" или "недостаточное" количество информации. С этой меркой мы походили к разделению СР на два большие класса: СР без обучения, обучающиеся и самообучающиеся СР. То есть, для СР без обучения имели дело с полной информацией, а для ОСР - с неполной (нет описания классов на языке признаков), а для ССР - еще с большей неполнотой (отсутствует даже алфавит классов).
Однако заметим, что само понятие “неполнота информации” - качественное, относительное. Для СР без обучения при прочих равных условиях этой информации просто больше. Это означает, что результативность СР при имеющемся объеме априорной информации значительно выше, чем имеем в той ситуации, которая требует создания ОСР. О результативности СР, для которой невозможно априорно назначит алфавит классов говорить вообще нельзя. Что же касается примененного здесь выражения "результативность значительно выше", то из последующего изучения курса будет понятно, что этому казалось бы опять-таки качественному утверждению соответствуют вполне конкретные количественные показатели.
С Р
Простые Сложные
Без обучения С обучением С самообучением
Детермини
рованные Вероятностные Логические Структурные
Комбинированные
Рис. 5
Таким образом, отсюда следует, что информацией никогда пренебрегать не стоит. Поэтому при построении как ОСР, ССР и просто СР необходимо всегда использовать принцип обратной связи для расширения объема информации. То есть, результаты решения задачи распознавания неизвестных объектов после апостериорного подтверждения правильности их классификации необходимо использовать для уточнения описания классов в простых СР без обучения и для дополнительного обучения в ОСР и ССР.
Для решения таких задач приведенные схемы СР должны быть дополнены соответствующими функциональными связями дообучения.
* * *
Классификация СР была бы неполной, если бы мы не коснулись экспертных систем, стоящих несколько в стороне от приведенной методологии построения изучаемых нами классических СР.
Как вы уже знаете, эти системы основываются на методах искусственного интеллекта.
Классические решения задач распознавания основываются на моделировании математико-алгоритмических функций (уравнения, системы уравнений) детерминированных или стохастических систем с точным определением области применения, значений параметров, диапазонов сигналов, интервалов времени, частотных диапазонов и т.п. Эти задачи опираются на надежные, точно научно обоснованные знания. В них реализуются новые и оригинальные достижения высококвалифицированных специалистов, имеющих в то же время узкую специализацию. Однако такие специалисты достаточно редки. Это и побуждает создавать экспертные системы, основанные на представлении неалгоритмического, логического, декларативного характера, нечеткого и слабо формализованного знания в виде множества фактов и правил, причинно-следственных связей.
Указанные знания при этом могут быть как заслуживающими доверия и опробированными многочисленными независимыми применениями, так и сомнительными.
Экспертные системы распознавания - это специализированные автоматы обработки знаний для интерактивного и кооперативного решения проблем распознавания на естественном профессиональном языке со способностями приобретения, хранения и представления знаний в форме алгоритмических программ с одной стороны и неалгоритмических фактов и правил, с другой стороны.
Изучение экспертных систем - это отдельный предмет с его методами и подходами.