Распознавание в биологических и технических
системах
1.1
Распознавание образов в жизни человека
( Введение)
1.1.1. Всеобъемлющий характер действия механизмов распознавания.
Распознавание образов (а часто говорят - объектов, сигналов, ситуаций, явлений или процессов) - самая распространенная задача, которую человеку приходится решать практически ежесекундно от первого до последнего дня своего существования. Для этого он использует огромные ресурсы своего мозга, которые мы оцениваем таким показателем как число нейронов, равное 1010.
Можно даже не утруждая себя примерами (мы рассмотрим их ниже) заметить, что похожие действия наблюдаются в биологии, в живой природе, а иногда даже в неживой. Кроме того, распознавание постоянно встречается в технике. А если это так, то, очевидно, следует считать механизм распознавания всеобъемлющим.
С более общих позиций можно утверждать, и это вполне очевидно, что в повседневной деятельности человек постоянно сталкивается с задачами, связанными с принятием решений, обусловленных непрерывно меняющейся окружающей обстановкой. В этом процессе принимают участие: органы чувств, с помощью которых человек воспринимает информацию извне; центральная нервная система, осуществляющая отбор, переработку информации и принятие решений; двигательные органы, реализующие принятое решение. Но в основе решений этих задач лежит, в чем легко убедиться, распознавание образов.
В своей практике люди решают разнообразные задачи по классификации и распознаванию объектов, явлений и ситуаций (мгновенно узнают друг друга, с большой скоростью читают печатные и рукописные тексты, безошибочно водят автомобили в сложном потоке уличного движения, осуществляют отбраковку деталей на конвейере, разгадывают коды, древнюю египетскую клинопись и т.д.).
Рассмотрим некоторые примеры всепроникающего механизма распознавания образов человеком в природе и обществе.
1.Вы легко узнаете издалека своего знакомого (но задайтесь вопросом: как?) Обратите внимание на слабую зависимость результатов распознавания от дальности, если конечно мы еще видим отдельные элементы и движения.
2.Предположим Вам нужен для изучения или повторения такой раздел математики, как интегральное исчисление. Ваши действия :
а) распознаете по корешкам обложек справочник на книжной полке;
(на фоне других книг - прочитывая, распознавая названия при последовательном просмотре или по внешнему виду, хранимому Вами в памяти по предшествующему пользованию этим справочником)
б) листаете и распознаете страницу справочника с оглавлением; (по опыту знаете, что оглавление располагается в начале или в конце книги)
в) распознаете тексты заголовков оглавления; (читаете);
г) распознаете среди всех заголовков необходимый Вам (сравниваете прочитанный со смысловым содержанием интересующего Вас раздела)
д) распознаете соответствующую этому заголовку страницу; (зная, что в оглавлении против найденного раздела печатается интересующий номер страницы)
е) листаете справочник и распознаете по нумерации страниц необходимый номер;
(сравниваете запомненный номер с номерами открываемых страниц) и т.д., и т.п.
Обратите внимание, во-первых, на то, сколько знаний, хранящихся в Вашей памяти используется. Во-вторых, здесь, как и в предыдущих примерах, можно задаться многочисленными вопросами по поводу того, как это Вы сами все осуществляете, и не найти ответа.
В рассмотренном примере мы уже должны были заметить, что помимо “чистого” распознавания в нем присутствуют наши действия, но при этом любому действию предшествует распознавание. А любое выполненное действие влечет за собой новый этап распознавательной деятельности.
3.Вот может быть более очевидный пример из военного дела. Обратите в нем внимание на сочетание распознавания и действий, являющихся управлением.
Представьте себя в роли летчика в кабине самолета-истребителя. Вы взлетаете, набираете высоту, готовитесь и начинаете выполнять боевую задачу. Прежде всего:
-обнаруживаете (то есть, распознаете) в зоне обзора цель-самолет противника;
-идете на сближение;
-на основе имеющихся знаний о своем самолете как оружии - распознаете момент, когда произвести пуск ракеты по обнаруженной цели;
-производите пуск;
или:
-распознаете, что противник опередил Вас и произвел по вашему самолету пуск ракеты;
-распознаете среди большого набора тактических приемов в вашей памяти необходимый прием для управления самолетом в целях проведения противоракетного маневра;
-производите маневр.
-распознаете, что маневр удался (если не удался и есть возможность- повторяете) - и сами атакуете противника;
Затем:
-распознаете, что горючее на исходе или - задача выполнена - уходите на посадку;
-распознаете посадочную полосу - осуществляете посадку.
Вот далеко не полный и подробный перечень этапов распознавания и действий. Но если сами действия понятны и очевидны, то предшествующее им распознавание требует осмысливания соответствующего механизма. И прежде всего, каждый этап описанных последовательности - это действия на основе знаний, хранящихся в памяти.
4. Рассмотрим пример из области экономики. Руководитель экономического региона по экономическим показателям хозяйственной деятельности обнаруживает (распознает) ухудшение продовольственного обеспечения области, города и т.п.
Обратившись к другой группе экономических показателей, он распознает, что лежит в основе такого нежелательного явления (например, отсутствие горючего для автотранспорта). В итоге принимается решение о дополнительных договорах на бензин или дизельное топливо с поставщиками или, найдя новых поставщиков, организует отправку железнодорожного состава цистерн или автозаправщиков для доставки и т.д.
5. Еще один военный пример из области обороны, где человек не выполняет ни распознающей функции, ни функции управления. СПРН (система предупреждения о ракетном нападении), находясь в режиме круглосуточного боевого дежурства автоматически обнаруживает в некоторый момент времени (то есть, распознает) КО (космический объект) и завязывает его траекторию. На этой основе автоматически определяется не является ли этот КО баллистической ракетой (распознается по попаданию пролонгированной во время полета КО точки его падения на обороняемую территорию, на территорию страны). Если указанное условие выполнилось СПРН дает сигнал тревоги на средства противодействия , например систему противоракетной обороны (ПРО). Система ПРО, в свою очередь, обязана автоматически по данным СПРН обнаружить (распознать ) интересующую цель, распознать, например, что это сложная баллистическая цель СБЦ (боевая часть БЧ +ложные цели ЛЦ), распознать БЧ среди ЛЦ, произвести пуск противоракеты и т.д., и т.п.
6.Теперь примеры из области биологии.
Семечко растения распознает достаточность температуры окружающей среды, достаточность влаги, питательных веществ - и включает механизм роста.
Росянка распознает насекомое, севшее на ее лепестки и резко закрывается как ловушка для последующего переваривания пищи.
Подсолнечник распознает, где расположено солнце, и поворачивает свое соцветие в его сторону.
Комар распознает человека и пьет его кровь.
Лягушка распознает и ловит комара.
Удав распознает и ловит лягушку. и т.д.
И здесь также мы задаемся уже знакомым нам вопросом: как?
7. Совсем уже утрированный случай из техники: дверной замок распознает свой ключ и разрешает открыть помещение.
В последнем примере человек, как создатель, знает все.
Таким образом, приведенные примеры показывают, что распознавание в природе, обществе, в жизни человека, в технике - всеобъемлюще. Но при этом мы отмечаем, что ответов на поставленные вопросы, когда речь касается распознающей деятельности человека в большинстве случаев мы не найдем. До настоящего времени полные представления о способностях живых организмов в распознавании многих явлений и объектов отсутствуют. В то же время, создавая технические системы, способные заменить его, человек высказывает гипотезы, продвигающие его к знанию распознающей деятельности в природе, что позволяет ему успешно решать стоящие задачи. Рассматриваемый курс “Основы построения систем распознавания образов” и должен научить пониманию того, что лежит в основе современных гипотез распознавательной деятельности и как на этой основе упомянутые задачи решаются.
1.1.2. Краткая история вопроса появления технических систем автоматического распознавания и методов их создания
Длительное время вопросы распознавания рассматривались человеком лишь с позиций методов биологии и психологии. При этом целью изучения являлись в основном качественные характеристики, не позволяющие вскрыть и точно описать соответствующий механизм. Если и получались числовые характеристики, то они, как правило, были связаны с изучением рецепторов, таких как органы зрения, слуха, осязания. Что же касалось характеристик принятия решений, то до их математической оценки дело не доходило. И только кибернетика позволила ввести в изучение психологического процесса распознавания образов, лежащего в основе принятия любых решений, количественные методы, что открыло принципиально новые возможности в исследовании и проектировании автоматических систем распознавания. Только кибернетика позволила ввести в область распознавания, как явления природы, математические представления. В этом можно увидеть в частности реализацию взглядов Галилея, который утверждал:
“Книга природы написана на языке математики. И тот, кто хочет прочесть ее, должен изучать этот язык”.
Исторически сложилось, что многие задачи такого класса, как распознавание метеоосадков; распознавание авиационной ситуации в районе аэропорта авиадиспетчером; распознавание полосы посадки летчиком в сложных условиях, человек, как правило, решает эффективно, то есть с необходимым качеством. Этим и объясняется исторически появившаяся необходимость использования человека в качестве элемента или звена сложных автоматических систем.
Примечательно то, что в процессе указанной деятельности человека число принимаемых решений по результатам распознавания ситуаций конечно, в то время как число состояний внешней среды, оцениваемых в процессе самого распознавания и приводящих к указанным решениям, может быть бесконечным.
Это можно видеть на примере машинистки, печатающей под диктовку. Из бесчисленного множества вариантов произношения одного и того же звука она выбирает только один, всегда ударяя по одной, определенной клавише пишущей машинки. В результате она безошибочно печатает слова, независимо от их искажения при устном произнесении.
К принятию такого конечного числа решений человек подготовлен всем своим жизненным опытом. Поэтому принятие идеологии автоматизации указанных процессов, замены человека как звена автоматических систем привело к тому, что человечество прежде всего научилось строить автоматы, способные реагировать на множество изменений характеристик внешней среды некоторым ограниченным числом рациональных решений (реакций) исполнительных органов этих автоматов. Это не значит, что были найдены механизмы, лежащие в основе человеческих и природных способностей распознавания, но главные особенности этих способностей, лежащие на поверхности представлений, созданные автоматы во многих случаях хорошо имитировали.
Например, автомат, управляющий технологическим процессом выпуска некоторой продукции, реагирует на случайные изменения качества ее путем регулирования количества той или иной компоненты исходного материала, режима работы и т.п., но только при достижении определенного уровня этих изменений. То есть, реакция осуществляется не на любое изменение, а на множество их, совокупность.
В результате человечество пришло к ситуации, когда распознающие устройства могут повышать, например, эффективность систем связи (распознавая сигналы в шумах), помогают устанавливать объективный диагноз заболеваний (распознавая всегда однозначно в отличии от человека симптомы-признаки заболеваний), дают возможность осуществлять автоматический контроль сложных технических систем и вовремя вмешиваться и проводить их ремонтно-восстановительные работы и т.д.
Создание устройств, которые выполняют функции распознавания различных объектов, во многих случаях открывает возможность замены человека как элемента сложной системы специализированным автоматом. Такая замена позволяет значительно расширить возможности различных систем, выполняющих сложные информационно-логические задачи. Заметим здесь, что качество работ, выполняемых человеком на любом рабочем месте зависит от квалификации, опыта, добросовестности, состояния. В то же время автомат его заменяющий действует однообразно и обеспечивает всегда одинаковое качество, если он исправен.
Но не только указанная замена и освобождение человека от выполнения рутинных операций является причиной создания и поиска путей создания ряда систем распознавания. В некоторых случаях человек вообще не в состоянии решать эту задачу со скоростью, задаваемой обстоятельствами, не зависимо от качеств и психологического состояния принимающего решение (Например: противоракетный маневр самолета в сложных метеоусловиях; вывод из рабочего режима АЭС и т.п.). Автомат же с такими задачами может легко справляться.
Итак, основные цели замены человека в задачах распознавания сводятся к следующим:
1) Освобождение человека от однообразных рутинных операций для решения других более важных задач.
2) Повышение качества выполняемых работ.
3) Повышение скорости решения задач.
В течение достаточно продолжительного времени проблема распознавания привлекает внимание специалистов в области прикладной математики, а затем и информатики. Так можно, в частности, отметить работы Р.Фишера, выполненные в 20-х годах и приведшие к формированию дискриминантного анализа, как одного из разделов теории и практики распознавания. В 40-х годах А.Н.Колмогоровым и А.Я.Хинчиным поставлена задача о разделении смеси двух распределений.
Наиболее плодотворными явились 50-60-е годы ХХ века. В это время на основе массы работ появилась теория статистических решений. В результате этого появления найдены алгоритмы, обеспечивающие отнесение нового объекта к одному из заданных классов, что явилось началом планомерного научного поиска и практических разработок. В рамках кибернетики начало формироваться новое научное направление, связанное с разработкой теоретических основ и практической реализации устройств, а затем и систем, предназначенных для распознавания объектов, явлений, процессов.
Новая научная дисциплина получила название “Распознавание образов”.
Таким образом, базой для решения задач отнесения объектов к тому или иному классу послужили, как это отмечается сегодня, результаты классической теории статистических решений. В ее рамках строились алгоритмы , обеспечивающие на основе экспериментальных измерений параметров (признаков), характеризующих этот объект, а также некоторых априорных данных, описывающих классы, определение конкретного класса, к которому может быть отнесен распознаваемый объект.
В последующем математический аппарат теории распознавания расширился за счет применения:
-разделов прикладной математики;
-теории информации;
-методов алгебры логики;
-математического программирования и системотехники.
(Системотехника - научное направление, охватывающее проектирование, создание, испытания и эксплуатацию сложных систем).
К середине 70-х годов определился облик распознавания как самостоятельного научного направления, появилась возможность создания нормальной математической теории распознавания. В этом нам придется убедиться, а также приобрести необходимые навыки, прослушав курс “Основы построения систем распознавания образов”.
Первая отечественная работа в области распознавания образов - работа основоположника современной теории информации Харкевича Александра Александровича - “Опознавание образов” .”Радиотехника” т.14,15. 1959 г.
Наши отечественные ученые, внесшие существенный вклад в эту дисциплину:
В.М.Глушков, В.С.Михалевич, В.С.Пугачев, НП.Бусленко, Ю.И.Журавлев, Я.З.Цыпкин, А.Г.Ивахненко, М.А.Айзерман, Э.М.Браверман, М.М.Бонгард, В.Н.Вапник, Г.П.Тартаковский, В.Г.Репин, Л.А.Растригин, А.Л.Горелик и др.
Зарубежные ученые:
1-й Ф.Розенблатт - 1957г , Персепторон - простейшая модель мозга, решающая задачи распознавания.
Р.Гонсалес, У.Гренандер, Р.Дуда, Г.Себестиан, Дж.Ту, К.Фу, П.Харт.
1.2
Терминология и отличительные особенности систем распознавания
1.2.1. Основные определения
В силу чисто исторических причин класс задач распознавания связан с понятием “образа”. В свое время не обратили внимания, что в заимствованном из англоязычных работ термине “pattern recognition” термин “pattern”, кроме значения “образ”, имеет еще значение “модель”, стиль”, “режим”, “закономерность”, “образ действия”. В современном распознавании и особенно искусственном интеллекте его употребляют в самом широком смысле, имея в виду, что “образ” - это некоторое структурированное приближенное (обратите внимание - “приближенное”!) описание (эскиз) изучаемого объекта, явления или процесса.
То есть, частичная определенность описания является принципиальным свойством образа.
Основное назначение описаний (образов) - это их использование в процессе установления соответствия объектов, то есть при доказательстве их идентичности, аналогичности, подобия, сходства и т.п., которое осуществляется путем сравнения (сопоставления). Два образа считаются подобными, если удается установить их соответствие. Можно, в частности, считать, что имеет место соответствие, если достигнута их идентичность.
Сопоставление образов представляет собой основную задачу распознавания и играет существенную роль в информатике в целом. Эта задача возникает, в частности, в различных разделах искусственного интеллекта, например в понимании естественного языка компьютером, символьной обработке алгебраических выражений, экспертных системах, преобразовании и синтезе программ ЭВМ.
Теперь отметим следующий важный момент, что в различных задачах образу придается различный смысл. Это определяется часто тем, какие характеристики объекта входят в описание образа, какой аппарат используется для представления этих характеристик. Именно отсюда и можно понять, почему образ является приближенным описанием объекта. Чем большее число свойств и качеств объекта отражено на принятом языке в образе рассматриваемого объекта, тем полнее это описание, тем полнее этот образ характеризует описываемый объект. Однако в любом случае мы имеем дело с описанием, а не с самим объектом, который всегда богаче описания. Итак, любой образ представляется некоторым набором признаков. Поэтому вполне допустимо наряду с выражением “распознавание образов” применять выражение “отождествление некоторых наборов описаний объектов”.
* * *
Достаточно наглядно и теоретически и практически понимается различие между объектом и образом, если рассмотреть различия между картиной (художественное полотно), являющейся плоским объектом, и таким ее изображением как фотографическое или компьютерное, введенное телекамерой или сканером.
Простота примера состоит в том, что как картина, так и ее изображение на пленке или в телевизионном кадре записи - двумерны. Вводя соответствующие системы координат, представим их так
f(a,b) - объект;
g(x,y) - изображение объекта.
Общепринято объект обозначать буквой f, а изображение -g.
Заметим сразу, что изображение может выступать как образ картины в том числе в автоматической системе распознавания, будучи введенным в компьютер для прямого сопоставления с другими изображениями. Но при этом обратим внимание и на то, что изображение здесь - это уже не сам объект.
Можно понять, что идеальная изображающая система - это такая система, для которой в любой точке пространства выполняется равенство f = g. На практике почти не существует таких систем. Функциональные связи между f и g всегда подлежат экспериментальному определению.
Для понимания сути вопроса рассмотрим простейшую оптическую систему получения фотографий картины, нарисованной на двухмерном экране. Здесь мы имеем дело с объектом, лежащем в плоскости, и таким же плоским изображением.
В данном примере распределения f и g имеют одну и ту же размерность, поскольку они являются пространственным распределением интенсивности света или его цвета в плоскости.
Фотография формируется квантами света, отраженного от картины, прошедшего через линзовую систему фотоаппарата и попавшего на фотопленку. Такое формирование изображения приводит к потери качества за счет искажений и несовершенства приемного устройства, и следовательно, в этом случае f и g не равны друг другу. И только если известен закон потери качества, то можно провести компенсацию искажений путем соответствующей обработки изображения.
Другим примером могут быть двухмерные изображения g распределения f радиационного препарата в организме человека, полученные с помощью гамма-камеры, поворачивающейся последовательно на определенные углы относительно пациента. Здесь надо избавиться от иллюзии того, что полученные детали изображения соответствуют областям интереса врача-диагноста. Дело в том, что рассмотренное визуализированное изображение - это не распределение активности поглощения в теле пациента, а распределение интенсивностей только в элементах изображения.
То есть, изображение g есть некоторое представление (описание) объекта f, которое, хотя и располагается в том же месте, но может иметь отличия не только качественные, но и такие количественные как размеры. В данном случае приходится констатировать, что процессы в гамма-камере, с помощью которой производится регистрация исходных данных, на сегодняшний день не имеют математического описания, позволяющего связать объект с его изображением. Это еще раз заставляет подчеркнуть, что врач не видит изменений интенсивности поглощения гамма-излучения в теле пациента, а только - распределение интенсивностей на изображении, полученном с помощью системы регистрации. А отсутствие математического описания связей изображения и процесса не позволяет строго трактовать результаты медицинского наблюдения. Остается надеяться только на опыт врача.
Разумно считать, что объект и его изображение физически совпадают и связаны друг с другом соотношениями, характеризующими конкретный метод визуализации, хотя в ряде случаев могут иметь отличающиеся размеры.
Таким образом, в общем случае не существует идеального (1:1) соответствия между информацией, содержащейся в какой-либо точке с координатами (a, b), и информацией, соответствующей точке (x, y). В принципе информацию от каждой точки объекта можно “рассеять” по всем точкам изображения. Однако в любом полезном методе визуализации главный вклад в каждую точку (a, b) будет давать отдельная конкретная точка (x, y). Другие, соседние точки будут вносить меньшее количество информации, причем уменьшение указанного вклада происходит достаточно резко по мере удаления от основной точки с координатами (x, y). Эти выводы известны как принцип близости, а распределение по изображению некоторой точки из пространства объекта может зависеть как от значения поля в точке объекта, так и от поля в точках, расположенных около этой точки и удаленных на бесконечное расстояние от нее.
Какая же существует физическая связь между пространством объекта и пространством изображения?
В плоскость изображения попадает информация исходя из наличия информации в плоскости объекта, а также в зависимости от того, какой кодирующий носитель информации используется в данном методе визуализации (фотография формируется за счет переноса фотонов, яркостная картина УЗИ - за счет рассеяния продольных ультразвуковых волн, степень поглощения радиационных препаратов - путем счета испущенных g-квантов, рентгенограмма - за счет линейного затухания рентгеновских квантов и т.п.).
Введем функцию h(x,y,a,b), которая описывает пространственные связи для точечного процесса, то есть процесса, который отличен от нуля лишь в точке с координатами (a' ,b' ). Тогда зарегистрированное изображение будет иметь вид:
Здесь зависимость распределения изображения от амплитуды сигнала точечного источника учтена введением в функцию h пятого аргумента.
Рассмотрим теперь сигнал от второго точечного объекта, расположенного там же, где и первый:
Согласно принципу суперпозиции излученные энергии сигналов суммируются:
Это - нелинейная суперпозиция в силу нелинейности слагаемых в правой части равенства. В итоге, как видим, суммированию измеряемых распределений в плоскости изображения не соответствует сложение функций в плоскости объекта.
Если же система линейна, то
а суперпозиция будет иметь следующий вид
То есть, в случае линейности системы сложение функций в плоскости объекта приводит к суммированию распределений в плоскости изображения с точностью до единственной функции преобразования h.
Математически последнее является очень важным упрощением, так как линейность в рассматриваемых задачах предполагается всегда в первом приближении, даже когда это, строго говоря, не соответствует действительности.
Теперь можно перейти к обобщенным соотношениям, связывающим пространства объекта и его изображения. Для нелинейной системы визуализации имеем:
а для линейной
Функция h, используемая для связи распределений f и g, называется функцией отклика точечного источника (ФОТИ). Зависимость ее от всех четырех пространственных координат определяет ФОТИ как пространственно-зависимую. Если же точечный процесс одинаков для всех точек плоскости объекта, то h - пространственно-инвариантна. При этом h зависит лишь от разности координат (x-a,y-b). Для пространственно-инвариантной системы
при этом для линейной пространственно-инвариантной системы
Последнее выражение известно как интеграл свертки, согласно которому распределение по изображению представляет собой свертку распределения по объекту с ФОТИ. Именно функция h описывает процесс переноса информации от объекта в пространство изображения и характеризует все геометрические искажения, присущие процессу визуализации.
Окончательное упрощение обобщенных соотношений, описывающих процесс формирования изображений, получается в том случае, когда свойства системы в двух перпендикулярных направлениях не коррелируют друг с другом. Это означает, что двухмерную ФОТИ можно представить в виде произведения двух одномерных ФОТИ. Так для пространственно-зависимой системы имеем
а для пространственно-инвариантной
Это свойство системы называется разделимостью.
В итоге для линейной, пространственно-инвариантной разделимой системы получаем
Учитывая рассмотренное, легко понять, что, наблюдая изображение, мы не можем считать его точным представлением распределения по объекту. Это можно заметить путем внимательного рассмотрения изображения и сравнения его с объектом или явлением. Причина - несовершенства системы визуализации.
Именно поэтому в теории обработки изображений большое внимание уделяется методам исключения соответствующих искажений, получившим название обращение свертки (Вытекает из рассмотрения хотя бы последнего интеграла свертки!).
В соответствующих задачах интеграл свертки рассматривается с учетом искажения изображений шумами. Так для линейных систем полное представление о задаче создает выражение
где n(x,y) - распределение шума в изображении.
* * *
Теперь сконцентрируем внимание на следующем важном термине распознавания образов - “класс”. Здесь, прежде всего, обратим внимание на то, что как человек, так и автомат принимают решение на основе отождествления совокупности конкретных значений характеристик объектов или явлений не просто друг с другом, а обычно с некоторым классом, в который объединяются объекты или явления, имеющие общие свойства (например: характеристики выхода из строя агрегатов и систем той же АЭС - класс опасных отказов или класс отказов, требующих определенного технического вмешательства, но неопасных).
Таким образом, классы - это объединения объектов (явлений), отличающиеся общими свойствами, интересующими человека.
Всегда, имея в виду цель распознавания, в конечном итоге принятое решение об отнесении объекта к тому или иному классу определяет реакцию соответствующей системы на данную входную ситуацию однозначно.
Таким образом, в самых общих чертах распознавание можно определить как соотнесение объектов или явлений на основе анализа их характеристик, представляющих образы этих объектов, с одним из нескольких, заранее определенных классов.
И следует обратить внимание на то, что термин “распознавание” в равной мере относится как к процессам восприятия и познания, свойственным человеку и живым организмам, так и к техническим попыткам человека реализовать “электронные” или “вычислительные” аналоги этих процессов, то есть к решению задач в рамках предмета распознавания как раздела информатики.
1.2.2. Системы распознавания
До этого мы говорили о проблеме распознавания в целом, о теории, о возможности замены человека автоматом. Теперь сосредоточим внимание на практическом применении соответствующих знаний. При этом обратим внимание и на то, что те практические реализации методов распознавания , о которых в этих случаях шла речь, носят название систем распознавания (СР).
Здесь необходимо подчеркнуть, что именно центральную задачу распознавания образов представляет построение на основе систематических теоретических и экспериментальных исследований эффективных вычислительных средств (объединяемых в понятии “системы распознавания”) для отнесения описаний с объектов, явлений, процессов к соответствующим классам.
Широкий круг задач, возлагаемых на такие системы, определяется приведенным нами определением самого понятия “распознавание” и включает выяснение по разнородной, часто неполной, нечеткой, искаженной и косвенной информации факта, обладают ли изучаемые объекты, явления, процессы, ситуации фиксированным конечным набором свойств, позволяющим отнести их к определенному классу. Сюда входят как непосредственно задачи распознавания и классификации, так и такие задачи, в результате решения которых на основе распознавания требуется выяснить, в какой области из конечного числа областей будут находиться некоторые процессы через определенный промежуток времени.
Отсюда понятно, что к задачам распознавания должны относиться задачи технической и медицинской диагностики, геологического прогнозирования, прогнозирования свойств химических соединений, распознавания свойств динамических и статических объектов в сложной фоновой обстановке и при наличии активных и пассивных помех, прогнозирования урожая, обнаружения лесных пожаров, управления производственными процессами.
Разработки систем распознавания, начатые с 50-х годов, исчисляются тысячами. Сегодня уже трудно назвать такую отрасль науки и сферы производства, где СР не используются или не будут. При этом применение методов распознавания в ряде направлений науки и техники оказывает обратное влияние на эти направления, поистине революционизирующее влияние.
Рассмотрим некоторые применения.
1) Системы технической диагностики.
Их внедрение - важнейший фактор повышения эффективности использования машин и технологического оборудования, резкого сокращения расходов на эксплуатацию.
Исторически сложившаяся тенденция усложнения, а значит удорожания машин постоянно увеличивает затраты на эксплуатацию. Выход - переход к системам технической диагностики (распознавания состояния машин), например, безразборный поиск неисправностей. В результате вместо планово-предупредительного ремонта - ремонт по фактической необходимости. Например, в инструкции по эксплуатации автомобиля предусмотрены плановые технические обслуживания через 500 км, 1000 км, 2000 км и т.д. Если же его оснастить системами распознавания состояний, то от плановых ТО можно было бы отказаться заменив их обслуживанием отдельных узлов и систем по необходимости.
2) Медицинская диагностика.
Автоматизированные системы диагностики в медицине - путь увеличения
- широты и глубины охвата симптомов;
( рассчитывать только на память врача во всех ситуациях очень трудно. Лучше функцию памяти отдать компьютеру)
-оперативности;
(компьютер обеспечит почти мгновенный результат)
-достоверности.
(диагноз компьютера не зависит от внешних факторов, как это случается с человеком)
3) Сельское хозяйство.
Области применения здесь:
-распознавание размеров урожая по данным космических наблюдений;
-уменьшение ручного труда при сортировке плодов по форме, цвету и размерам и т.п.
4) Военное дело.
Сложные системы вооружения:
-автоматический функциональный контроль технического состояния систем и ввод резервирующих;
-роботы, обслуживающие фазированные антенные решетки радаров.
На основе рассмотренного можно уже ответить на вопрос, что же представляет собой СР.
В первом приближении:
“СР - это автоматическое вычислительное устройство, предназначенное для распознавания образов (каких? можно уже не повторяться).
Заметим, что это очень поверхностное определение. Сегодня физически СР это и вычислительная машина как один составляющий элемент СР;
-это и такие часто более дорогостоящие технические средства, как средства обнаружения распознаваемых объектов (например, патологических изменений того или иного органа человека);
-это и средства измерений параметров обнаруженных объектов (без них не получить признаков распознавания);
-это и математическое обеспечение, в составе которого: методы и алгоритмы обработки измерительной информации; методы и алгоритмы определения признаков распознавания; методы и алгоритмы непосредственно распознавания объектов, явлений , процессов ( построения решающих правил отнесения объектов к тому или иному классу); методы и алгоритмы в некотором смысле оптимального управления процессом распознавания; методы и алгоритмы оценки эффективности СР как на стадии проектирования, так и в процессе ее функционирования;
-наконец, для больших систем это и коллектив подготовленных специалистов обеспечивающих жизненный цикл существования системы.
Рассмотрим подробнее отдельные элементы.
а) Средства обнаружения распознаваемых объектов.
К ним в разных областях применения относятся:
в медицине:
-рентгеновские аппараты;
-аппараты УЗИ;
-ЯМР-томографы;
-энцефалографы;
-рентгеновские томографы;
-кардиографы и т.д.
в военном деле:
-радиолокаторы;
-оптические (лазерные) локаторы;
-лазерные дальномеры;
-приемники гамма-излучения;
-сонары - ультразвуковые локаторы.
Средства обнаружения представляют дорогостоящую часть СР. Но этим дорогостоящая часть СР не ограничивается.
б) Средства сопряжения.
Для сопряжения средств обнаружения с ЭВМ необходимы специальные электронные устройства аппаратного интерфейса. Эти составные части СР также достаточно дорогостоящи.
в)Средства измерений параметров распознаваемых объектов,явлений, процессов.
Средства измерений часто входят в состав обнаружителей (РЛС - измерение дальностей, углов, Рс/Рш).
г) Методы и алгоритмы обработки измерительной информации
Часто для получения признаков распознавания или параметров , которые их обусловливают необходима специальная математическая обработка (пример, для РЛС - определение дальностей целей по временной задержке сигналов, угловых координат по разности фаз, коэффициентов лобового сопротивления целей по координатам и их производным и т.п.).
Сам процесс назначения признаков - творческий процесс, говорят - эвристический, зависящий от человека.
д) Методы и алгоритмы принятия решения о принадлежности объектов распознавания.
е) Методы и алгоритмы оптимального управления распознаванием.
ж) Методы и алгоритмы оценки эффективности распознавания.
Как алгоритмы принятия решений, так и управление распознаванием, так и оценка эффективности определяются сложностью систем распознавания и представляют концентрированное применение комплекса математических операций соответствующего назначения.
з) Э В М
Наконец, ЭВМ. Это обязательный элемент современной СР. Вся обработка измерений с целью выделения признаков распознавания, вся математика классификации, управления и оценки эффективности выполняется ЭВМ. Само развитие теории и методов распознавания обязано появлению ЭВМ.
и) Коллектив подготовленных специалистов.
Такая составляющая на первый взгляд не имеет отношения к системе. Однако без коллектива подготовленных специалистов трудно обойтись в больших системах, решения которых чрезвычайно ответственны. В таких системах оценка эффективности - это показатель, которым пользуются с момента создания СР и до конца ее существования. При этом пользуются этим показателем специалисты, а не система. А сама необходимость такого использования связана с тем, что в процессе работ появляется возможность повысить эффективность СР за счет получения новых данных и уточнения параметров системы в результате анализа специалистами конкретного случая распознавания с последующим уточнением этими специалистами имеющихся параметров. То есть, система в течение своей жизни (говорят - “жизненного цикла”) изменяется (динамизм системы).
Таким образом, СР - сложная динамическая система, состоящая в общем случае из коллектива подготовленных специалистов и совокупности технических средств получения и переработки информации, обеспечивающих на основе специально сконструированных алгоритмов решение задачи классификации соответствующих объектов, явлений или процессов.
После того, как описан состав и функции элементов СР, для завершения общих представлений о проблеме распознавания можно провести и некоторые поверхностные сравнения технических СР и такой совершенной СР, как человек.
Так рецепторы человека, к которым мы относим зрительные, слуховые, осязательные, обонятельные и вкусовые рецепторы - это средства обнаружения, а иногда и измерения характеристик распознаваемых объектов, явлений, процессов. Тут аналогия полнейшая.
Далее на пути оперирования с информацией у технических СР стоит устройство сопряжения с ЭВМ. Естественными аналогами его являются биологические средства связи человеческих рецепторов с мозгом, выполняющим роль ЭВМ.
Но это, пожалуй, - все, что мы сегодня знаем наверняка. И вопросов здесь больше, чем ответов:
-какие функции выполняют рецепторы в части первичной обработки результатов обнаружения объектов, явлений;
-каковы характеристики линий передачи данных от рецепторов к мозгу как ЦВС;
-какие признаки выделяет система обработки;
-какие алгоритмы использует мозг для решения задачи классификации, оптимального управления процессом распознавания;
-как человеку удается избавиться от специфичности, свойственной техническим СР и т.д.
В процессе нашего дальнейшего изучения предмета Вы сами поставите еще много нерешенных в этом плане вопросов. А их разрешение чрезвычайно важно для построения быстродействующих и высокоэффективных технических СР, помогающих человеку в его повседневной практике.
Достижение соответствующих целей - задачи XXI века.