Реферат по предмету "Информатика"


Разработка элективного курса Основы искусственного интеллекта

--PAGE_BREAK--К процедурным знаниям относятся сведения о способах оперирования или пре­образования декларативных знаний.
Интенсиональные и экстенсиональные знания
Интенсиональные знания — это знания о связях между атрибутами (признака­ми) объектов данной предметной области. Они оперируют абстрактными объек­тами, событиями и отношениями.
Экстенсиональные знания представляют собой данные, характеризующие конк­ретные объекты, их состояния, значения параметров в пространстве и времени.
Глубинные и поверхностные знания
В глубинных знаниях отражается понимание структуры предметной области, на­значение и взаимосвязь отдельных понятий (глубинные знания в фундаменталь­ных науках — это законы и теоретические основания). Поверхностные знания обычно касаются внешних эмпирических ассоциаций с каким-либо феноменом предметной области.
Например, для разговора по телефону требуется лишь поверхностное знание того, что, сняв трубку и правильно набрав номер, мы соединимся с нужным абонен­том. Большинство людей не испытывает необходимости в глубинных представ­лениях о структуре телефонной связи, конструкции телефонного аппарата, ко­торыми, безусловно, пользуются специалисты по телефонии.
Отмечается, что большинство экспертных систем основано на применении поверхностных знаний. Это, однако, нередко не мешает достигать вполне удов­летворительных результатов. Вместе с тем, опора на глубинные представления помогает создавать более мощные, гибкие и интеллектуальные адаптивные сис­темы. Наглядным примером может служить медицина. Здесь молодой и недос­таточно опытный врач часто действует по поверхностной модели: «Если кашель — то пить таблетки от кашля, если ангина — то эритромицин» и т. п. В то же время опытный врач, основываясь на глубинных знаниях, способен порождать разно­образные способы лечения одной и той же болезни в зависимости от индивиду­альных особенностей пациента, его состояния, наличия доступных лекарств в аптечной сети и т. д.
Глубинные знания являются результатом обобщения первичных понятий пред­метной области в некоторые более абстрактные структуры. Степень глубины и уровень обобщенности знаний непосредственно связаны с опытом экспертов и могут служить показателем их профессионального мастерства.
Жесткие и мягкие знания
Жесткие знания позволяют получать однозначные четкие рекомендации при заданных начальных условиях. Мягкие знания допускают множественные, «раз­мытые» решения и различные варианты рекомендаций (рис. П.16).
Характеристика различных предметных областей по глубине и жесткости дает возможность проследить тенденцию развития интеллектуальных систем.

Рис. П.16. Тенденция развития интеллектуальных систем
Как видно из рисунка, область практического применения интеллектуальных систем все более смещается в сферу задач с преобладанием глубинных и мягких знаний. Такие задачи еще называют трудно формализуемыми. Для них харак­терна одна или несколько следующих особенностей:
·                    задача не может быть определена в числовой форме (требуется символьное представление);
·                    алгоритмическое решение задачи не известно (хотя, возможно, и существует), или не может быть использовано из-за ограниченных ресурсов (памяти компьютера, быстродействия);
·                    цели задачи не могут быть выражены в терминах точно определенной целевой функции или не существует точной математической модели задачи
Системы, основанные на знаниях, не отвергают и не заменяют традиционных подходов к решению формализованных задач. Они отличаются тем, что ориентированы на решение трудно формализуемых задач. Интеллектуальные системы особенно важны там, где наука не может создать конструктивных определений, область определений меняется, ситуации зависят от контекстов и языковая (описательная) модель доминирует над алгоритмической.

1.2.2. Модели представления знаний Наиболее распространенными моделями представления знаний являются:
·                    продукционные системы;
·                    логические модели;
·                    фреймы;
·                    семантические сети.
Продукционные системы
В продукционных системах знания представляются в виде совокупности специ­альных информационных единиц.
В общем случае продукционная система включает следующие компоненты:
·                    базу данных, содержащую множество фактов;
·                    базу правил, содержащую набор продукций;
·                    интерпретатор (механизм логического вывода) или правила работы с продук­циями.
База правил и база данных образуют базу знаний. Факты в базе данных пред­ставляют собой краткосрочную информацию и в принципе могут изменяться в ходе работы продукционной системы по мере накопления опыта. Правила явля­ются более долговременной информацией и предназначены для порождения гипотез (новых фактов) из того, что уже известно.
Продукционные системы делят на два типа — с прямыми и обратными вывода­ми. При прямом выводе рассуждение ведется от данных к гипотезам, а при об­ратном производится поиск доказательства или опровержения некоторой гипотезы. Часто используются комбинации прямой и обратной цепи рассуждений.
Продукции по сравнению с другими формами представления знаний имеют сле­дующие преимущества:
·                    модульность;
·                    единообразие структуры (основные компоненты продукционной системы могут применяться для построения интеллектуальных систем с различной проблемной ориентацией);
·                    естественность (вывод заключения в продукционной системе во многом ана­логичен процессу рассуждений эксперта);
·                    гибкость родовидовой иерархии понятий, которая поддерживается только как связи между правилами (изменение правила влечет за собой изменение в иерархии).
 Однако продукционные системы не свободны от недостатков:
·                    процесс вывода менее эффективен, чем в других системах, поскольку боль­шая часть времени при выводе затрачивается на непроизводительную проверку применимости правил;
·                    этот процесс трудно поддается управлению;
·                    сложно представить родовидовую иерархию понятий.
Представление знаний с помощью продукций иногда называют «плоским», так как в продукционных системах отсутствуют средства для установления иерар­хии правил. Объем базы знаний продукционных систем растет линейно, по мере включения в нее новых фрагментов знаний, в то время как в традиционных алго­ритмических системах, использующих деревья решений, зависимость между объ­емом базы знаний и количеством собственно знаний является логарифмической.
Логические модели
Логические модели представления знаний реализуются средствами логики пре­дикатов.
Предикатом называется функция, принимающая только два значения — истина и ложь — и предназначенная для выражения свойств объектов или связей между ними. Выражение, в котором утверждается или отрицается наличие каких-либо свойств у объекта, называется высказыванием. Константы служат для именова­ния объектов предметной области. Логические предложения или высказывания образуют атомарные формулы. Интерпретация предиката — это множество всех допустимых связываний переменных с константами. Связывание представляет собой подстановку констант вместо переменных. Предикат считается общезна­чимым, если он истинен на всех возможных интерпретациях. Говорят, что выс­казывание логически следует из заданных посылок, если оно истинно всегда, когда истинны посылки.
Наиболее простым языком логики является исчисление высказываний, в котором отсутствуют переменные. Любому высказыванию можно приписать значение истинно или ложно. Отдельные высказывания могут соединяться связками И, ИЛИ, НЕ, которые называются булевыми операторами. Основу исчисления выс­казываний составляют правила образования сложных высказываний из атомар­ных.
Здесь переменные обозначают логические высказывания, о которых можно ска­зать, что они истинны или ложны. Логические операторы имеются в большин­стве языков программирования. Однако исчисление высказываний — недоста­точно выразительное средство для обработки знаний, поскольку в нем не могут быть представлены предложения, включающие переменные с кванторами.
Исчисление предикатов с кванторами (логика предикатов) является расшире­нием исчисления высказываний, в котором для выражения отношений между объектами предметной области могут использоваться предложения, включающие не только константы, но и переменные.
В общем случае модели, основанные на логике предикатов, описываются фор­мальной системой, которая задается четверкой:
М = (Т, Р, А, П),
где Т — множество базовых элементов или алфавит формальной системы; Р — множество синтаксических правил, с помощью которых можно строить син­таксически корректные предложения; А — множество аксиом или некоторых синтаксически правильных предложений, заданных априорно; П — правила продукций (правила вывода или семантические правила), с помо­щью которых можно расширять множество А, добавляя в него синтаксически правильные предложения.
Главное преимущество логических моделей представления знаний заключается в возможности непосредственно запрограммировать механизм вывода синтакси­чески правильных высказываний. Примером такого механизма служит, в част­ности, процедура вывода, построенная на основе метода резолюций. Однако с помощью правил, задающих синтаксис языка, нельзя установить истинность или ложность того или иного высказывания. Причем это распространяется абсо­лютно на все языки. Высказывание может быть построено синтаксически пра­вильно, но оказаться совершенно бессмысленным.
Логические модели представления и манипулирования знаниями были особен­но популярны в 70-х годах. Тогда казалось, что с появлением языков программи­рования типа ПРОЛОГ процедуры логического вывода в исчислении предика­тов будут достаточны для решения всех типов задач в интеллектуальных системах. Вместе с тем, по мере того как в поле зрения исследователей включались все новые интеллектуальные задачи, стало ясно, что говорить о доказательном выводе можно только в небольшом числе случаев, когда проблемная область, в которой реша­ется задача, формально описана и полностью известна. Но большинство задач, где интеллект человека позволяет находить нужные решения, связано с областя­ми, где знания принципиально неполны, неточны, некорректны и характеризу­ются еще немалым числом характеристик, начинающихся с частицы «не». При таких условиях речь может идти только о правдоподобном выводе, при ко­тором окончательный результат получается лишь с некоторой оценкой уверен­ности в его истинности. Кроме того, специалисты, работающие в плохо форма­лизованных областях (например, в медицине), рассуждают совсем не так, как представители точных наук. Для них весомым аргументом в пользу принятия какого-либо положения может быть мнение ряда признанных в этих областях авторитетов или, например, сходство доказываемого положения с другим, для которого решение уже известно. Поэтому дальнейшее развитие баз знаний по­шло по пути работ в области индуктивных логик, логик «здравого смысла», ло­гик веры и других логических систем, имеющих мало общего с классической ма­тематической логикой.
Фреймы
 Фрейм чаще всего определяют как структуру данных для представления стерео­типных ситуаций. Модель представления знаний на основе фреймов использует концепцию организации памяти, понимания и обучения человека, предложен­ную М. Минским (1979). Фрейм (дословно — «рамка») — это единица представ­ления знаний, детали которой могут изменяться в соответствии с текущей ситу­ацией. Фрейм в любой момент может быть дополнен различной информацией, касающейся способов применения данного фрейма, последствий этого примене­ния и т. п.
Структура фрейма состоит из характеристик описываемой стереотипной ситуации и их значений, которые называются, соответственно, слотами и заполнителями слотов.
Имя фрейма:
Имя первого слота, значение первого слота
Имя второго слота, значение второго слота
Имя К-го слота, значение К-го слота
Незаполненный фрейм называется протофреймом, а заполненный — экзофреймом. Роль протофрейма как оболочки в экзофрейме весьма важна. Эта оболочка позволяет осуществлять процедуру внутренней интерпретации, благодаря кото­рой данные в памяти системы не безлики, а имеют вполне определенный, изве­стный системе смысл.
Слот может содержать не только конкретное значение, но и имя процедуры, позволяющей вычислить его по заданному алгоритму, а также одну или несколь­ко продукций (эвристик), с помощью которых это значение определяется. В слот может входить не одно, а несколько значений. Иногда этот слот включает ком­понент, называемый фасетом, который задает диапазон или перечень его воз­можных значений. Фасет указывает также граничные значения заполнителя слота.
Как уже отмечалось, помимо конкретного значения в слоте могут храниться процедуры и правила, которые вызываются при необходимости вычисления это­го значения. Среди них выделяют процедуры-демоны и процедуры-слуги. Первые запускаются автоматически при выполнении некоторого условия, а вторые ак­тивизируются только по специальному запросу. Если, например, фрейм, описы­вающий человека, включает слоты ДАТА РОЖДЕНИЯ и ВОЗРАСТ и в первом из них находится некоторое значение, то во втором слоте может стоять имя про­цедуры-демона, вычисляющей возраст по дате рождения и текущей дате и акти­визирующейся при каждом изменении текущей даты.
Совокупность фреймов, моделирующая какую-либо предметную область, пред­ставляет собой иерархическую структуру, в которую фреймы собираются с по­мощью родовидовых связей. На верхнем уровне иерархии находится фрейм, со­держащий наиболее общую информацию, истинную для всех остальных фреймов. Фреймы обладают способностью наследовать значения характеристик своих родителей, находящихся на более высоком уровне иерархии. Эти значения мо­гут передаваться по умолчанию фреймам, находящимся ниже них в иерархии, но если последние содержат собственные значения данных характеристик, то в качестве истинных принимаются именно они. Это обстоятельство позволяет без затруднений учитывать во фреймовых системах различного рода исключения.
Различают статические и динамические системы фреймов. В системах первого типа фреймы не могут быть изменены в процессе решения задачи, а в системах второго типа это допустимо.
О системах программирования, основанных на фреймах, говорят, что они явля­ются объектно-ориентированными. Каждый фрейм соответствует некоторому объекту предметной области, а слоты содержат описывающие этот объект данные, то есть в слотах находятся значения признаков объектов. Фрейм может быть представлен в виде списка свойств, а если использовать средства базы данных, то в виде записи.
Наиболее ярко достоинства фреймовых систем представления знаний проявля­ются в том случае, если родовидовые связи изменяются нечасто и предметная область насчитывает немного исключений. Во фреймовых системах данные о родовидовых связях хранятся явно, как и знания других типов. Значения слотов представляются в системе в единственном экземпляре, поскольку включаются только в один фрейм, описывающий наиболее общие понятия из всех тех, кото­рые содержит слот с данным именем. Такое свойство систем фреймов обеспечи­вает экономное размещение базы знаний в памяти компьютера. Еще одно досто­инство фреймов состоит в том, что значение любого слота может быть вычислено с помощью соответствующих процедур или найдено эвристическими методами. То есть фреймы позволяют манипулировать как декларативными, так и проце­дурными знаниями.
    продолжение
--PAGE_BREAK--К недостаткам фреймовых систем относят их относительно высокую сложность, что проявляется в снижении скорости работы механизма вывода и увеличении трудоемкости внесения изменений в родовидовую иерархию. Поэтому большое внимание при разработке фреймовых систем уделяют наглядным способам ото­бражения и эффективным средствам редактирования фреймовых структур.
Семантические сети
Семантическая сеть описывает знания в виде сетевых структур. В качестве вер­шин сети выступают понятия, факты, объекты, события и т. п., а в качестве дуг сети — отношения, которыми вершины связаны между собой. Так, семантичес­кая сеть, представляющая знания об автомобиле гр. Васильева, показана на рис. П. 17.
Семантические сети часто рассматривают как общий формализм для представ­ления знаний. Частным случаем таких сетей являются сценарии, в которых в качестве отношений выступают каузальные отношения или отношения типа «цель — средство».
Вершины сети соединяются дугой, если соответствующие объекты предметной области находятся в каком-либо отношении. Самыми распространенными явля­ются следующие типы отношений:
БЫТЬ ЭЛЕМЕНТОМ КЛАССА (ЯВЛЯТЬСЯ) — означает, что объект входит в состав данного класса, например: ВАЗ 2106 является автомобилем;
ИМЕТЬ — позволяет задавать свойства объектов, например: жираф имеет длин­ную шею;
ЯВЛЯТЬСЯ СЛЕДСТВИЕМ — отражает причинно-следственные связи, напри­мер: астеническое состояние является следствием перенесенного простудного заболевания;
ИМЕТЬ ЗНАЧЕНИЕ — задает значение свойств объектов, например: пациент может иметь двух братьев.
Как и в системе, основанной на фреймах, в семантической сети могут быть пред­ставлены родовидовые отношения, которые позволяют реализовывать наследо­вание свойств от объектов-родителей. Это обстоятельство приводит к тому, что семантические сети приобретают все недостатки и достоинства представления знаний в виде фреймов. Преимущества заключаются в простоте и наглядности описания предметной области. Однако последнее свойство с усложнением семан­тической сети теряется и, кроме того, существенно увеличивается время вывода. Также к недостаткам семантических сетей относят сложность обработки различ­ного рода исключений.

Другие методы представления знаний
Из других методов представления знаний популярностью пользуется представ­ление знаний по примерам. Работая с системой такого типа, пользователь задает ей несколько примеров решения задач из актуальной предметной облас­ти. На основе этих примеров система самостоятельно строит базу знаний, кото­рая затем применяется для решения других задач. При создании базы знаний пользователь имеет возможность в любой момент вызвать на экран дисплея мат­рицу, состоящую из примеров задач и их решений, с тем чтобы установить в ней наличие пустых мест, которые необходимо заполнить недостающими примера­ми «задача—решение».
Знания в такой системе могут храниться в различной форме. Это может быть, например, интенсиональная форма, когда пользователь вводит в систему прави­ла операций с атрибутами объектов предметной области, приводящие к требуе­мому решению. Также это может быть экстенсиональная форма, при которой каждый пример детально описывается пользователем и представляется в памя­ти компьютера в виде совокупности значений выделенных атрибутов. Возможно сочетание и той, и другой форм. В результате получается матрица примеров, ко­торая может быть расширена или изменена лишь путем корректировки приме­ров, содержащихся в матрице, или их добавлением.
Основным достоинством представления знаний по примерам является простота данного способа, поскольку пользователь может не иметь ни малейшего пред­ставления о продукционных правилах, исчислении предикатов, фреймах и семан­тических сетях. Вместе с тем, в качестве недостатков метода представления знаний по примерам отмечают отсутствие гибкости процесса построения интеллектуаль­ной системы. Пользователь оказывается отстраненным от собственно создания базы знаний и поэтому не может контролировать связи между содержащимися в ней понятиями.
Выбор способа представления знаний осуществляется инженером по знаниям после того, как им достигнуто понимание природы данных моделируемой обла­сти. При решении сложных задач возможны ситуации, когда источники знаний различаются по типам, и, соответственно, представление таких знаний требует использования разных способов (смешанное представление). Тогда для продук­тивного функционирования интеллектуальной системы нередко применяют прин­цип доски объявлений, с помощью которого реализуется взаимодействие различ­ных независимых источников знаний.

1.3. Приобретение знаний Извлечение знаний – процесс взаимодействия инженера по знаниям с источником знаний (экспертом), в результате которого становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области. Занимается извлечением знаний инженер по знаниям. Инженер по знаниям – это специалист по искусственному интеллекту, проектирующий и создающий экспертную систему. Обычно инженер по знаниям выступает в роли посредника между экспертом и базой знаний.
Для получения знаний инженером по знаниям ему необходим эксперт. Эксперт – это специалист, который за годы обучения и практической деятельности научился эффективно решать задачи, относящиеся к конкретной предметной области. Эксперт – это специалист, который может делать экспертные оценки. Экспертные оценки – это основанные на суждениях специалистов количественные или бальные оценки процессов или явлений, не поддающихся непосредственному измерению.
Понятие «управление знаниями» (Knowledge Management, КМ) родилось в середине 90-х годов в крупных корпорациях, где проблемы обработки информации приобрели особую остроту, став критическими. Выяснилось, что основное узкое место — это обработка знаний, накопленных специалистами компании (именно такие знания обеспечивают ей преимущество перед конкурентами). Знание, которое не используется и не возрастает, и в конечном счете устаревает и становится бесполезным, точно так же, как деньги, которые хранятся, не превращаясь в оборотный капитал, в конечном счете обесцениваются. Знание же, которое распространяется, приобретается и обменивается, наоборот, генерирует новое знание. Существуют десятки определений знания, но в системах KM знания — это фундаментальный ресурс, базирующийся на практическом опыте специалистов и на данных, используемых на конкретном предприятии.
Ресурсы знаний различаются в зависимости от отраслей индустрии и приложений, но, как правило, в них входят методики, технологии, процедуры обработки информации, накопившиеся в процессе функционирования предприятия; руководства, письма, новости, сведения о заказчиках и конкурентах, схемы, чертежи и другие данные. Традиционно проектировщики систем КМ ориентируются в основном на менеджеров, хотя есть и тенденция принимать в расчет более широкий круг работников организации.
Для интеграции в единый комплекс системы KM используют ряд технологий:
·                    традиционные системы автоматизации и информационно-поисковые системы;
·                    электронную почту, корпоративные сети и Интернет-сервисы;
·                    базы и хранилища данных (data warehouse);
·                    системы электронного документооборота;
·                    специализированные программы обработки данных (например, статистического анализа);
·                    экспертные системы и базы знаний.
При разработке систем КМ можно выделить следующие этапы.
 Накопление. Стихийное и бессистемное накопление информации в организации.
 Извлечение. Процесс переноса компетентности специалистов на аналитика. Это один из наиболее сложных и трудоемких этапов, от его успешности зависит дальнейшая жизнеспособность системы.
 Структурирование и формализация. На этом этапе должны быть выделены основные понятия, выработана структура представления информации. Она должна быть максимально наглядной и такой, чтобы ее было легко изменять и дополнять. Именно на этом этапе создаются описания и модели бизнес процессов и структуры потоков информации.
 Проектирование системы. Предметная постановка задачи, разработка архитектуры и спецификаций для программирования.
 Программная реализация. Разработка собственно программного комплекса системы.
 Обслуживание. Под ним понимается корректировка формализованных данных и знаний (добавление, обновление); «чистка» — удаление устаревшей информации; фильтрация данных и знаний для поиска информации, необходимой пользователям.
Это не единственно возможное описание процесса разработки, но оно позволяет понять, что происходит при создании реальных систем управления знаниями. В литературе достаточно подробно описаны лишь этапы проектирования и реализации, при том, что основную сложность представляют этапы извлечения и структурирования. Мало кто из разработчиков знает, что существует наука под названием «инженерия знаний» (knowledge engineering), возникшая в русле разработки интеллектуальных систем, или систем, основанных на знаниях, примерно 15-20 лет назад.
Поскольку основная проблема инженерии знаний — это процесс извлечения знаний, разработчикам систем KM и в первую очередь аналитику необходимо четко понимать природу и особенности этих процессов. Можно выделить три основных аспекта процесса извлечения знаний:
A = {A1, А2, А3} = {психологический, лингвистический, гносеологический}.
Следует отметить, что даже если речь идет о разработке традиционной информационной системы, а не системы KM, проблемы инженерии знаний не теряют своей актуальности.
Из трех аспектов извлечения знаний наиболее важен психологический (А1), поскольку он определяет успешность и эффективность взаимодействия (общения) аналитика с основным источником знаний — специалистами предприятия.

1.3.1. Приобретение и извлечение знаний Существует определение термина приобретение знаний: «Передача и преобразование опыта решения проблем, полученного от некоторого источника знаний, в программу».
Термин приобретение знаний носит обобщенный характер и совершенно нейтрален к способу передачи знаний. Например, передача может осуществляться с помощью специальной программы, которая в процессе обработки большого массива историй болезни устанавливает связь между симптомами и заболеваниями. А вот термин извлечение знаний относится именно к одному из способов передачи знаний — опросу экспертов в определенной проблемной области, который выполняется аналитиком или инженером по знаниям. Последний затем создает компьютерную программу, представляющую такие знания (или поручает это кому-нибудь другому, обеспечивая его всей необходимой информацией).
Этот же термин применяется и для обозначения процесса взаимодействия эксперта со специальной программой, целью которого является:
·                    извлечь каким-либо систематическим способом знания, которыми обладает эксперт, например, предлагая эксперту репрезентативные задачи и фиксируя предлагаемые способы их решения;
·                    сохранить полученные таким образом знания в некотором промежуточном виде;
·                    преобразовать знания из промежуточного представления в вид, пригодный для практического использования в программе, например в набор порождающих правил.
Преимущество использования такой программы — снижение трудоемкости процесса, поскольку перенос знаний от эксперта к системе осуществляется в один прием.

1.3.2. Теоретический анализ процесса приобретения знаний Стадии приобретения знаний
Можно выделить несколько стадий приобретения знаний.
(1) Идентификация. Анализируется класс проблем, которые предполагается решать с помощью проектируемой системы, включая данные, которыми нужно оперировать, и критерии оценки качества решений. Определяются ресурсы, доступные при разработке проекта, — источники экспертных знаний, трудоемкость, ограничения по времени, стоимости и вычислительным ресурсам.
(2) Концептуализация. Формулируются базовые концепции и отношения между ними. Сюда же входят и характеристика различных видов используемых данных, анализ информационных потоков и лежащих в их основе структур в предметной области в терминах причинно-следственных связей, отношений частное/целое, постоянное/временное и т.п.
(3) Формализация. Предпринимается попытка представить структуру пространства состояний и характер методов поиска в нем. Выполняется оценка полноты и степени достоверности (неопределенности) информации и других ограничений, накладываемых на логическую интерпретацию данных, таких как зависимость от времени, надежность и полнота различных источников информации.
(4) Реализация. Преобразование формализованных знаний в работающую программу, причем на первый план выходит спецификация методов организации управления процессом и уточнение деталей организации информационных потоков. Правила преобразуются в форму, пригодную для выполнения программой в выбранном режиме управления. Принимаются решения об используемых структурах данных и разбиении программы на ряд более или менее независимых модулей.
(5) Тестирование. Проверка работы созданного варианта системы на большом числе репрезентативных задач. В процессе тестирования анализируются возможные источники ошибок в поведении системы. Чаще всего таким источником является имеющийся в системе набор правил. Оказывается, что в нем не хватает каких-то правил, другие не совсем корректны, а между некоторыми обнаруживается противоречие.

1.3.3. Методы извлечение знаний из памяти эксперта В этом разделе рассмотрены особенности процедуры взаимодействия инженера по знаниям с источником знаний (экспертом), позволяющей сделать явными рассуждения специалистов при принятии решений и структуру их представле­ний о предметной области.
Процедура взаимодействия инженера по знаниям с экспертом
Известен парадоксальный факт Джонсона о том, что по мере накопления опыта специалист-эксперт все больше утрачивает умение словесно выражать свои зна­ния. Имеются достаточно убедительные психологические доказательства того, что люди далеко не всегда в состоянии достоверно описать свои мыслительные про­цессы. Теоретик искусственного интеллекта Марвин Минский писал, что «само­сознание — это сложная, но тщательно сконструированная иллюзия...» и что «….только как исключение, а не как правило, человек может объяснить то, что он знает».
Другое психологическое положение состоит в том, что опыт эксперта — это инту­иция, которая трудно поддается выражению в форме правил типа «ЕСЛИ — ТО». Широко известно высказывание Лао-Цзы («старого учителя»): «Кто скажет, тот не знает, кто знает, тот не скажет».
Тем не менее, инженерия знаний предлагает определенные методы (приемы, способы) работы с экспертами. Эти методы направлены на «раскручивание» лабиринтов памяти экспертов, в которых хранятся знания, часто имеющие не­вербальный характер.
Классификация методов работы с экспертами
В основу излагаемого материала положена классификация коммуникативных методов работы инженера по знаниям.
Под коммуникативными методами понимают все виды контактов инженера по знаниям с живым источником знаний — экспертом. Среди этих методов выделя­ют две большие группы: активные и пассивные (рис. П.21).
Пассивные методы подразумевают, что ведущая роль в процедуре извлечения знаний принадлежит эксперту. При этом инженер по знаниям главным образом протоколирует рассуждения и действия эксперта.
В активных методах инициатива полностью в руках инженера по знаниям. Он ведет с экспертом беседу, предлагает различные «игры», организует «круглый стол» и т. д.
    продолжение
--PAGE_BREAK--Пассивные методы на первый взгляд просты. Вместе с тем, они требуют от ин­женера по знаниям умения анализировать «поток сознания» эксперта и выде­лять в нем ценные фрагменты знания.
Активные методы разделяют на две группы в зависимости от числа экспертов, участвующих в процедуре извлечения знаний. В групповых методах большое значение имеет дискуссия между экспертами, в которой нередко выявляются нетривиальные аспекты знаний. В то же время, ведущую роль на сегодняшний день играют индивидуальные методы. В значительной степени это связано с де­ликатностью процедуры «отъема знаний».

Пассивные методы
Наблюдение
Метод наблюдения является единственным «чистым» методом, где инженер по знаниям не вмешивается в процесс работы эксперта и не навязывает ему какие-либо собственные представления. Выделяют две разновидности наблю­дений:
·                    Наблюдение за реальным процессом.
·                    Наблюдение за имитацией процесса.
 Сначала обычно применяют первую разновидность и наблюдают за реальным процессом на рабочем месте эксперта. Это помогает глубже понять предметную область и отметить все внешние особенности процедуры принятия решений, необходимые для проектирования интерфейса пользователя.
На втором этапе эксперт имитирует процесс. В таком режиме он менее напря­жен и работает на «два фронта» — ведет профессиональную деятельность и од­новременно демонстрирует ее.
 Сеансы наблюдений предъявляют к инженеру по знаниям следующие требования:
·                   Владение техникой стенографии.
·                   Знакомство с методиками хронометрирования для четкого структурирования производственного процесса во времени.
·                   Развитые навыки «чтения по глазам», то есть наблюдательность к жестам, мимике и другим невербальным компонентам общения.
·                   Предварительное знакомство с предметной областью.
Протоколы наблюдений после проведения сеансов тщательно расшифровываются, а затем обсуждаются с экспертом.
Анализ протоколов «мыслей вслух»
При протоколировании «мыслей вслух» эксперта просят раскрыть всю цепочку рассуждений, объясняющих его действия и решения. При таком протоколирова­нии считается важным зафиксировать не только весь «поток сознания» экспер­та, но даже паузы и междометия в речи эксперта. Иногда данный метод называ­ют «вербальными отчетами».
При протоколировании «мыслей вслух» эксперт может проявить себя максималь­но ярко. Он ничем не скован, ему никто не мешает, он как бы свободно парит в потоке собственных рассуждений и умозаключений, может блеснуть своей эру­дицией и продемонстрировать глубину познаний. Для большого числа экспер­тов это самый приятный и лестный способ извлечения знаний.
Вместе с тем, как отмечалось выше, далеко не каждый специалист, даже из числа умеющих произносить впечатляющие монологи о своей работе, оказывается в состоянии формализовать и структурировать рассуждения. Однако существуют люди, склонные к рефлексии, способные к конструктивному изложению мыслей. Такие люди — находка для инженера по знаниям.
Лекции
Лекторский дар встречается нечасто. Опытный лектор хорошо структурирует свои знания и ход рассуждений. Но бывает, некоторые люди обладают лекторским
даром, но не подозревают о его присутствии. В любом случае инженеру по зна­ниям стоит попробовать озадачить эксперта подготовкой лекции на интересую­щую тему. Если эксперт сумеет преодолеть специфический психологический барьер и войти в образ педагога, это может оказаться весьма эффективным для решения задачи извлечения знаний.
Хороший вопрос инженера по знаниям по ходу лекции имеет важное значение. Серьезные, глубокие и интересные вопросы, с одной стороны, стимулируют твор­ческое воображение лектора, и с другой — повышают авторитет инженера по знаниям.
Продолжительность лекций рекомендуется стандартная — от 40 до 50 минут, и через 5-10 минут — еще столько же. Весь курс должен занимать, как правило, от двух до пяти лекций.
Метод извлечения знаний в форме лекций, как и все пассивные методы, применя­ют в начале многоэтапной процедуры извлечения знаний из памяти эксперта. Он способствует быстрому погружению инженера по знаниям в предметную область.
Активные индивидуальные методы
Анкетирование
Анкетирование является наиболее стандартизированным методом. Составление анкеты — достаточно тонкий и ответственный момент. Вот несколько рекомен­даций:
·                   анкета не должна быть монотонной и однообразной, чтобы не вызывать ску­ку и усталость. Для этого вопросы должны варьироваться, тематика менять­ся. Кроме того, нередко в анкету вставляют специальные вопросы-шутки и игровые вопросы;
·                   анкета должна быть приспособлена к языку экспертов;
·                   следует учитывать, что вопросы влияют друг на друга. Поэтому последова­тельность вопросов должна быть хорошо продумана;
·                   анкета должна иметь «хорошие манеры». Ее нужно излагать ясным, понят­ным и предельно вежливым языком. Методическим мастерством составления анкеты можно овладеть только на практике.
Процедура анкетирования может проводиться двумя способами. В первом ана­литик вслух задает вопросы и сам заполняет анкету по ответам эксперта. Во вто­ром эксперт заполняет анкету самостоятельно после предварительного инструк­тирования.
Выбор способа зависит от ряда условий (в частности от оформления анкеты, ее понятности, готовности эксперта). Вместе с тем, второй способ представляется предпочтительным, так как у эксперта появляется неограниченное время на об­думывание вопросов и снижается так называемый эффект присутствия.
Интервью
Перед проведением интервью неплохо спросить себя: «А умеем ли мы задавать вопросы?» В философии эта проблема обсуждается с древности. Рассмотрим клас­сификацию вопросов (рис. П.22).
Открытый вопрос обозначает тему или предмет, предоставляя эксперту свободу по форме и содержанию ответа.
При закрытом вопросе эксперту предлагается набор ответов, среди которых он должен сделать выбор.

Закрытые вопросы легче обрабатываются, но они в определенной мере «програм­мируют» ответ эксперта и «закрывают» ход его рассуждений. Поэтому при со­ставлении сценария интервью обычно чередуют открытые и закрытые вопросы и особенно тщательно продумывают «меню» и содержание закрытых вопросов.
Личный вопрос апеллирует к индивидуальному опыту эксперта. Личные вопро­сы обычно активизируют мышление эксперта, «играют» на его самолюбии, ук­рашают интервью.
Безличный вопрос нацелен на выявление наиболее распространенных и общепри­нятых закономерностей предметной области.
При подготовке вопросов учитывают, что языковые возможности эксперта, как правило, ограничены. Кроме того, имеют в виду, что из-за замкнутости, скован­ности и робости отдельные эксперты не могут сразу высказать свое мнение и предоставить требуемые! знания. Поэтому часто используют не прямые вопросы, которые непосредственно указывают на предмет или тему, а косвенные, опосре­дованно направляющие внимание на актуальную проблему. Иногда в интересах дела приходится задавать несколько косвенных вопросов вместо одного прямого.
Вербальные вопросы — это традиционные устные вопросы.
Вопросы с использованием наглядного материала разнообразят интервью и сни­жают утомляемость эксперта. В качестве наглядного материала используют фо­тографии, рисунки и карточки.
Разделение вопросов по функции на основные, зондирующие и контрольные связано с тем, что нередко эксперт по каким-то причинам уходит в сторону от вопроса и основные вопросы интервью оказываются непродуктивными. Тогда аналитик применяет зондирующие вопросы, концентрирующие внимание эксперта в нужном направлении. Контрольные вопросы используют для проверки досто­верности и объективности полученной информации.
Нейтральные вопросы носят беспристрастный характер. В то же время, наводя­щие вопросы заставляют эксперта прислушаться или даже принять во внимание позицию интервьюера.
Кроме приведенных в классификации на рис. П.22, полезно различать и вклю­чать в интервью следующие виды вопросов:
·                   контактные («ломающие лед» между аналитиком и экспертом);
·                   буферные (для разграничения различных тем интервью);
·                   оживляющие память экспертов (для реконструкции отдельных случаев из практики);
·                   «провоцирующие» (для получения спонтанных, неподготовленных ответов).
Свободный диалог
При свободном диалоге инженера по знаниям с экспертом отсутствует какой-либо регламентированный план. Однако эта форма извлечения знаний требует самой серьезной предварительной подготовки. На рис. П.23 показана одна из рекомендуемых схем такой подготовки.

Квалифицированная подготовка к диалогу — подлинная драматургия. В ее сце­нарии предусматривают плавное развитие процедуры извлечения знаний от при­ятного впечатления в начале беседы к профессиональному контакту через про­буждение интереса и завоевание доверия эксперта.
Для обеспечения желания эксперта продолжать беседу обычно производят «по­глаживания» типа: «Я Вас понимаю...», «… Это очень интересно» и т. п. При этом поведение аналитика должно быть искренним, ведь давно известно, что лучшая уловка — избегать всяких уловок и относиться к собеседнику с истинным ува­жением и настоящим интересом.
Существует каталог свойств идеального интервьюера: «Он должен выглядеть здоровым, спокойным, уверенным, внушать доверие, быть искренним, веселым, проявлять интерес к беседе, быть опрятно одетым, ухоженным».
Активные групповые методы
Активные групповые методы сами по себе не могут служить источником более или менее полного знания. Они выступают как дополнительные и служат хоро­шей «приправой» к индивидуальным методам извлечения знаний, активизиру­ющей мышление и поведение экспертов.
«Круглый стол»
Метод круглого стола предполагает равноправное обсуждение интересующей проблемы несколькими экспертами. Задача дискуссии — коллективно, с разных точек зрения, под разными углами исследовать спорные проблемы предметной области. Для остроты на «круглый стол» приглашают представителей различ­ных научных направлений и поколений. Число участников дискуссии обычно колеблется от трех до пяти-семи.
Перед началом дискуссии ведущему (инженеру по знаниям) необходимо убедить­ся, что все участники правильно понимают задачу. Затем нужно установить рег­ламент и четко сформулировать тему.
По ходу дискуссии важно проследить, чтобы слишком эмоциональные и разго­ворчивые эксперты не подменяли тему и чтобы критика позиций друг друга была обоснованной. Определенные усилия ведущий должен приложить для уменьше­ния «эффекта фасада», когда у участников превалирует желание произвести впечатление на других и они говорят совсем не то, что сказали бы в нормальной обстановке.
«Мозговой штурм»
«Мозговой штурм» или «мозговая атака» — один из наиболее популярных мето­дов раскрепощения и активизации человеческого мышления. Впервые этот ме­тод был использован в 1939 году А. Осборном в США для генерации новых идей. Основное положение штурма — отделение процедуры генерации идей в замкну­той группе специалистов от процесса их анализа и оценки.
Обычная продолжительность штурма — порядка 40 минут. Количество участни­ков — до 10 человек. Этим участникам предлагается высказать на заданную тему любые мысли, в том числе шутливые, фантастические и ошибочные. Критика зап­рещена. Регламент — до 2 минут на выступление.
Из опыта известно, что число высказанных идей часто превышает 50. Наиболее существенный момент штурма — наступление пика (ажиотажа), когда идеи на­чинают буквально «фонтанировать». Последующий анализ, который проводит группа сторонних экспертов, как правило, показывает, что всего лишь 10-15 % идей разумны, но среди них встречаются весьма оригинальные.
Искусство инженера по знаниям, проводящего «мозговой штурм», заключается в способности задавать вопросы аудитории, «подогревая» аудиторию. Вопросы служат своеобразным «крючком», которым извлекаются идеи.
Экспертные игры
Плодотворность моделирования реальных ситуаций в играх сегодня подтверж­дена практически во всех областях науки и техники. Ниже рассмотрены различ­ные виды экспертных игр в соответствии с классификацией.

Игры с экспертом
В играх с экспертом инженер по знаниям берет на себя какую-либо роль в моде­лируемой ситуации. Например, это может быть роль Ученика, который на глазах у эксперта (Учителя), поправляющего Ученика, выполняет работу на заданную тему. Такая игра — хороший способ разговорить застенчивого эксперта. Другой пример — игра в Специалиста (инженер по знаниям) и Консультанта (эксперт). Эта игра дает иногда впечатляющие результаты.
Для выявления скрытых пластов знания применяется игра, в которой специа­лист делает прогнозы в профессиональных ситуациях и дает им обоснования. Затем по истечении определенного времени специалисту предъявляют его соб­ственные обоснования и просят произвести по ним прогнозы. Как оказывается, такой простой прием нередко позволяет обнаружить пропущенные шаги в рас­суждениях эксперта.
В игре «фокусировка на контексте» эксперт выполняет роль экспертной систе­мы, а инженер по знаниям — роль пользователя. Моделируется ситуация кон­сультации. Первые реакции эксперта концентрируются вокруг наиболее значи­мых понятий и самых важных аспектов проблемы.
В целом по играм с экспертом даются следующие основные советы инженеру по знаниям:
·                   Играйте смелее, придумывайте игры сами.
·                   Не навязывайте игру эксперту, если он не расположен.
·                   Не «давите» на эксперта, не забывайте цели игры.
·                   Не забывайте о времени и о том, что игра утомительна для эксперта.
·                   Играйте весело, нешаблонно.
Ролевые игры в группе
В каждой групповой игре заранее составляется сценарий, распределяются роли, готовятся портреты-описания ролей и разрабатывается система оценивания иг­роков.
Известны различные способы проведения ролевых игр. В одних играх участни­ки придумывают себе новые имена и выступают под ними. В других все игроки переходят на «ты». В третьих роли выбирают игроки, в четвертых для распреде­ления ролей вытягивается жребий.
Обычно в игре, предназначенной для получения знания, принимают участие от трех до шести экспертов. В случае большего числа экспертов они разбиваются на группы, между которыми организуется состязание: чей диагноз окажется ближе к истинному, чей план рациональнее использует ресурсы, кто быстрее опреде­лить неисправность в техническом блоке и т. п.
Создание игровой обстановки требует фантазии и выдумки от инженера по зна­ниям. Главное, чтобы эксперты в игре максимально погрузились в ситуацию, действительно «заиграли», раскрепостились и «раскрыли свои карты».
    продолжение
--PAGE_BREAK--Игры с тренажерами
Тренажеры широко применяются для обучения профессиям, требующим дина­мического реагирования на изменяющуюся производственную ситуацию. Сюда относятся профессии летчиков, судоводителей, операторов атомных станций и др. Применение тренажеров для извлечения знаний позволяет фиксировать фраг­менты так называемых летучих знаний. Эти знания сиюминутны и, как правило, трудно воспроизводимы и выпадают из памяти в обычной обстановке при выхо­де из моделируемой ситуации.

1.3.4. Извлечение знаний: психологический аспект
Психологические проблемы извлечения знаний
Как известно, в процессе человеческого общения воспринимается далеко не вся возможная информация. В связи с этим актуальна проблема увеличения информативности общения аналитика и специалистов предприятия за счет использования психологических знаний.
Модель общения при извлечении знаний включает такие структурные компоненты: участники общения (партнеры); средства общения (процедура); предмет общения (знания). В соответствии с этой структурой выделим три «слоя» психологических проблем, возникающих при извлечении знаний.
Контактный слой
Разработка корпоративных систем — это коллективный процесс, для которого небезразлична атмосфера в группе разработчиков. Проводились эксперименты, результаты которых неоспоримо показывают, что дружеская атмосфера в коллективе больше влияет на результат, чем индивидуальные способности членов группы. Особенно важно, чтобы в коллективе разработчиков складывались кооперативные, а не конкурентные отношения.
Прогнозировать совместимость в общении со 100 %-ной гарантией невозможно. Однако можно выделить те факторы, черты личности, характера и другие особенности участников разработки, которые, несомненно, оказывают влияние на эффективность процедуры.
Пол и возраст. Значения этих параметров хотя и влияют на эффективность контакта, но не являются критическими. В литературе отмечается, что хорошие результаты дают гетерогенные (смешанные) пары мужчина/женщина. Что касается соотношения возрастов, лучше, когда оно подчиняется следующей зависимости:
20 > (Вэ — Ва) > 5
где Вэ — возраст эксперта-специалиста; Ва — возраст аналитика.
Характеристики личности и темперамента. Под личностью обычно понимается устойчивая система психологических черт, характеризующая индивидуальность человека. Рекомендуемые составляющие для аналитика: доброжелательность, аналитичность, хорошая память, внимание, наблюдательность, воображение, впечатлительность, большая собранность, настойчивость, общительность, находчивость.
Со времен Галена и Гиппократа, выделивших четыре классических типа темперамента, используются понятия холерик, сангвиник, меланхолик, флегматик. Для эффективной работы аналитика предпочтительны сангвинический и холерический темперамент.
Мотивация. На эффективность коллективного решения задач влияет и мотивация участников — их стремление к успеху. Аналитик в зависимости от условий разработки должен изыскивать разнообразные стимулы для экспертов-специалистов. Эксперт передает аналитику один из самых дорогих в мире продуктов — знания. И если одни люди делятся опытом добровольно и с удовольствием, то другие весьма неохотно приоткрывают свои профессиональные тайны. Иногда оказывается полезно возбудить в эксперте дух соперничества, конкуренции (не нарушая, естественно, обстановки кооперативности в коллективе).
Процедурный слой
Параметры процедурного слоя описывают процесс проведения процедуры извлечения знаний.
Ситуация общения (место, время, продолжительность). Беседу с экспертом лучше всего проводить в небольшом помещении наедине, поскольку посторонние люди нарушают доверительность беседы и могут породить эффект «фасада». Рабочее место эксперта — не лучший вариант, так как его могут отвлекать телефонные звонки, сотрудники и пр. Американский психолог И. Атватер считает, что для делового общения наиболее благоприятна дистанция между собеседниками от 1,2 до 3 м. Минимальным «комфортным» расстоянием можно считать 0,7-0,8 м. Реконструкция знаний- трудоемкий процесс, и поэтому длительность одного сеанса обычно не превышает 1,5-2 часов. Лучше выбрать эти два часа в первой половине дня, если эксперт относится к типу «жаворонок», и во второй, если он «сова». Известно, что взаимная утомляемость партнеров при беседе наступает обычно через 20-25 минут, поэтому в сеансе нужно делать паузы.
Оборудование (вспомогательные средства, освещенность, мебель). Одно из основных средств увеличения эффективности процесса извлечения знаний — использование наглядного материала. При этом учитывается, что большую часть информации человек получает при помощи зрения. Совет активнее пользоваться схемами и рисунками можно считать универсальным. Для протоколирования результатов сейчас используются следующие способы:
 запись на бумагу непосредственно по ходу беседы;
 запись на диктофон, помогающая аналитику проанализировать весь ход сеанса и свои ошибки;
 запоминание с последующей записью после.
Наиболее распространен первый способ. Наибольшая опасность при этом — потеря знаний, поскольку любая запись ответов — это уже интерпретация, привносящая субъективное понимание предмета. Значения параметров освещенности очевидны и связаны с влиянием внешних факторов на эксперта.
Профессиональные приемы (темп, стиль, методы и др.). Учет индивидуального темпа и стиля эксперта позволяет аналитику снизить напряженность процедуры извлечения знаний. Типичная ошибка — навязывание собственных темпа и стиля.
На успешность также влияет длина фраз, которые произносит аналитик. Это было установлено американскими учеными — лингвистом Ингве и психологом Миллером — при исследовании причин низкой усвояемости команд на военно-морском флоте США. Причиной оказалась длина команд. Выяснилось, что человек лучше всего воспринимает предложения глубиной (или длиной) 7±2 слова. Эта величина получила название «число Ингве — Миллера». Можно считать его мерой «разговорности» речи.
Большая часть информации поступает к аналитику в форме предложений на естественном языке. Однако внешняя речь эксперта есть воспроизведение его внутренней речи (мышления), которая гораздо богаче и многообразнее. Для передачи этой внутренней речи эксперт использует и невербальные средства, такие, как интонация, мимика, жесты. Опытный аналитик старается по возможности записывать в протоколы (в форме ремарок) и эту дополнительную интонацию.
Kогнитивный слой
Для эффективного моделирования когнитивных (от англ. cognition — познание), или познавательных, процессов необходимо учитывать их природу. На сегодняшний день эти вопросы наименее исследованы и требуют изучения так называемых когнитивных стилей. Под когнитивным стилем человека понимается совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого индивида. Когнитивный стиль определяет не столько эффективность деятельности, сколько способ достижения результата. Это способ познания, который позволяет людям с разными способностями добиваться одинаковых результатов в деятельности; система средств и индивидуальных приемов, к которым прибегает человек для организации своей деятельности.
Можно выделить несколько важных характеристик когнитивных стилей.
Полезависимость — поленезависимость. Поленезависимость позволяет человеку акцентировать внимание лишь на тех аспектах проблемы, которые необходимы для решения конкретной задачи, и отбрасывать все лишнее, т.е. не зависеть от фона или окружающего задачу шумового поля. Эта характеристика коррелирует с такими чертами личности, как невербальный интеллект, аналитичность мышления, способность к пониманию сути. Очевидно, что не только самому аналитику необходимо высокое значение этого параметра; поленезависимый эксперт — это тоже желательный фактор. Однако приходится учитывать, что полезависимые люди лучше общаются, они более контактны. Для общения особенно удачны гетерогенные (смешанные) пары: «полезависимый — поленезависимый».
Поленезависимость — одна из характерных профессиональных черт когнитивного стиля наиболее квалифицированных аналитиков. По некоторым данным, мужчины более поленезависимы, чем женщины.
Импульсивность — рефлективность (рефлексивность). Под импульсивностью понимается быстрое принятие решения (часто без достаточного обоснования), а под рефлексивностью — склонность к рассудительности. Рефлексивность, по экспериментальным данным, коррелирует со способностью к формированию понятий и продуктивностью стратегий решения логических задач. Таким образом, и аналитику, и эксперту желательно быть рефлексивными, хотя собственный стиль изменяется лишь частично и с большим напряжением.
Ригидность — гибкость. Этот фактор характеризует способность человека изменять установки и свою точку зрения в соответствии с изменяющейся ситуацией. Ригидные люди не склонны менять свои представления и структуру восприятия; гибкие, напротив, легко приспосабливаются к новой обстановке. Очевидно, что если эксперт еще может позволить себе ригидность (что характерно для долго работающих над одной проблемой специалистов, особенно старшего возраста), то аналитику эта характеристика когнитивного стиля явно противопоказана. Увеличение ригидности с возрастом отмечается многими психологами.
Когнитивная эквивалентность. Характеризует способность человека к различению понятий и разбиению их на классы и подклассы. Чем уже диапазон когнитивной эквивалентности, тем более тонкую классификацию способен провести индивид, тем большее количество признаков понятий он может выделить. Обычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин.
Психологические проблемы, рассмотренные в этой статье, далеко не исчерпывают всего комплекса теоретических и практических аспектов проблемы извлечения знаний. О других проблемах мы поговорим в следующих статьях этого цикла.

1.3.5. Оболочки систем приобретения знаний Приведенное выше разделение на этапы реализованы в среде KADS. В основе этого подхода лежит идея о том, что экспертная система является не контейнером, наполненным представленными экспертом знаниями, а «операционной моделью», которая демонстрирует некоторое нужное нам поведение в столкновении с явлениями реального мира. Приобретение знаний, таким образом, включает в себя не только извлечение специфических знаний о предметной области, но и интерпретацию извлеченных данных применительно к некоторой концептуальной оболочке и формализацию их таким способом, чтобы программа могла действительно использовать их в процессе работы.
В основу оболочки KADS положено пять базовых принципов.
(1) Использование множества моделей, позволяющее преодолеть сложность процессов инженерии знаний.
(2) Четырехуровневая структура для моделирования требуемой экспертности — набора качеств, лежащих в основе высокого уровня работы специалистов.
(3) Повторное использование родовых компонентов модели в качестве шаблонов, поддерживающих нисходящую стратегию приобретения знаний.
(4) Процесс дифференциации простых моделей в сложные.
(5) Важность преобразования моделей экспертности с сохранением структуры в процессе разработки и внедрения.
Первый из принципов, положенных в основу KADS, состоит в том, что оболочка должна содержать множество частных моделей, помогающих найти ответ на эти вопросы. Примерами таких моделей могут служить:
·                    организационная модель «социально-экономической среды», в которой должна функционировать система, например финансовые услуги, здравоохранение и т.п.;
·                    прикладная модель решаемой проблемы и выполняемой функции, например диагностика, планирование расписания работ и т.д.;
·                    модель задач, демонстрирующая, как должна выполняться специфицированная функция, для чего производится ее разбиение на отдельные задачи, например сбор данных о доходах, формирование гипотез о заболеваниях.
Описанные принципы построения оболочки системы приобретения знаний получили дальнейшее развитие в системе CommonKADS. Эта система поддержки инженерии знаний содержит редакторы каждого из перечисленных типов моделей и множество инструментальных средств и компонентов, облегчающих проектирование экспертной системы. Существенную помощь менеджеру проекта при планировании работ должна оказать модель жизненного цикла экспертной системы. В дополнение к тем моделям, которые входили в состав ранних версий оболочки KADS, в новую версию включено несколько новых, в частности модель агента, которая представляет саму экспертную систему, ее пользователей и подключенные вычислительные системы.
В рамках проекта KASTUS онтология и методология оболочки KADS была использована и при построении больших повторно используемых баз знаний. Наименование проекта KASTUS — сокращение от Knowledge about Complex Technical Systems for Multiple Use (знания многоразового применения о сложных технических системах). Цель проекта — создание системы знаний, которую можно было бы использовать в множестве разнообразных приложений.
Как правило, человек-эксперт знает о той предметной области, в которой он является специалистом, гораздо больше, чем может выразить на словах. Вряд ли можно добиться от него многого, задавая вопросы в общем виде, например: «Что вам известно об инфекционных заболеваниях крови?» Гораздо продуктивнее подход, реализованный в программе TEIRESIAS, который предполагает вовлечение эксперта в решение несложных репрезентативных задач из определенной предметной области и извлечение необходимых знаний в процессе такого решения.
Задавшись определенным набором базовых правил, представляющих прототип экспертной системы, TEIRESIAS решает в соответствии с этими правилами какую-нибудь из сформулированных репрезентативных проблем и предлагает эксперту критиковать результаты. В ответ эксперт должен сформулировать новые правила и откорректировать введенные ранее, а программа отслеживает внесенные изменения, анализирует их на предмет сохранения целостности и непротиворечивости всего набора правил, используя при этом модели правил. В процессе анализа используется обобщение правил различного вида.
Проект COMPASS можно считать одним из наиболее ярких примеров использования традиционной методики приобретения знаний, базирующейся на соответствующим образом организованном опросе экспертов. Такая методология «выросла» из предложенной Ньюэллом и Саймоном методики анализа протокола (protocol analysis). В этом разделе мы остановимся на проекте OPAL, в котором использована другая методика, отличающаяся от традиционной в двух важных аспектах.
·                   Эта методика ориентирована на частичную автоматизацию процесса извлечения знаний в ходе активного диалога интервьюируемого эксперта с программой.
·                   Методика приобретения знаний предполагает использование стратегии, направляемой знаниями о предметной области.
         Мы уже рассматривали программу TEIRESIAS, в которой использовалось множество средств поиска ошибок в существующем наборе правил, редактирования и тестирования откорректированного набора правил. Но для построения начального набора правил или отслеживания изменений в них программа TEIRESIAS не использовала какие-либо знания о предметной области. Программа OPAL, напротив, пытается «вытянуть» из пользователя как можно больше деталей, касающихся представления знаний и их использования. OPAL не является программой общего назначения. Она разработана специально для диагностики онкологических заболеваний и предназначена для формирования правил принятия решений на основе полученных от эксперта знаний о планах лечения в том или ином случае.
         Программа OPAL упрощает процесс извлечения знаний, предназначенных для использования в экспертной системе ONCOCIN. Последняя формирует план лечения больных онкозаболеваниями и заинтересована в использовании модели предметной области для получения знаний непосредственно от эксперта с помощью средств графического интерфейса. Понятие модель предметной области можно трактовать в терминах знаний различного вида, которыми обладает эксперт.
Независимо от того, о какой конкретной предметной области идет речь, игре в шахматы или медицинской диагностике, всегда существуют некоторые предварительные условия или предварительный опыт, которыми должен обладать субъект или техническая система, чтобы воспринимать знания об этой предметной области. Если речь идет об игре в шахматы, то по крайней мере нужно знать правила этой игры: как ходят фигуры, в чем цель игры и т.п. Применительно к медицинской диагностике нужно иметь представление о пациентах, заболеваниях, клинических тестах и т.п. Этот вид фоновых, или фундаментальных, знаний иногда в литературе по экспертным системам называют глубокими знаниями, противопоставляя их поверхностным знаниям, которые представляют собой хаотичный набор сведений о связях «стимул — реакция».
    продолжение
--PAGE_BREAK--При разработке прототипа системы ONCOCIN одной из наиболее сложных оказалась именно проблема приобретения знаний. Ввод информации, необходимой для создания протоколов лечения рака лимфатических узлов, занял около двух лет и отнял у экспертов около 800 часов рабочего времени. Формирование последующих наборов протоколов в процессе развития системы занимало, как правило, несколько месяцев. При этом было отмечено, что эффективность процесса приобретения знаний системой в решающей степени зависит от того, насколько успешно инженер по знаниям справляется с ролью переводчика в процессе передачи знаний от экспертов программе. Желание избавиться от этой зависимости и вдохновило разработчиков на создание программы OPAL, которая помогла бы автоматизировать процесс приобретения знаний.
Используя эту программу, эксперт может сформировать новый протокол в течение нескольких дней. За первый год эксплуатации программы OPAL в систему ONCOCIN было добавлено свыше трех дюжин новых протоколов. Эффективность использованного в этой программе метода заполнения формуляров при вводе новых знаний во многом объясняется тем, что в программу включены базовые знания о той предметной области, в которой она используется. Конечно, включение этих знаний потребовало значительных усилий от инженеров по знаниям, которые ранее занимались общением с экспертами, но эти затраты затем с лихвой окупились. Успешное применение программы OPAL показало преимущество представления знаний о предметной области на нескольких уровнях абстракции по сравнению с подходом, предполагающим переключение основного внимания на детали реализации.
Технология извлечения знаний о предметной области у эксперта посредством опроса через терминал в последнее время стала использоваться во множестве экспертных систем. В большинстве из них эксперту предлагается заполнить экранные формуляры, информация из которых затем считывается в структурированные объекты, аналогичные фреймам. Примерами таких систем могут служить ETS. Но далеко не во всех системах такого рода имеется столь развитый графический интерфейс, как в программе OPAL, и существует возможность компилировать полученные знания непосредственно в правила принятия решений. Реализация этих возможностей в OPAL существенно облегчается особенностями структурирования планов лечения больных, на что обращали внимание и авторы этой разработки.
Опыт, приобретенный в ходе разработки программы OPAL, был затем использован при создании PROTEGE — системы более общего назначения. Последняя версия этой системы, PROTEGE-II, представляет собой комплект инструментальных средств, облегчающих создание онтологии предметной области и формирование программ приобретения знаний, подобных OPAL, для различных приложений. Вместо того чтобы разрабатывать инструментальные средства общего назначения с нуля, авторы этой разработки пошли по пути повышения уровня абстракции ранее разработанного и успешно используемого приложения, как это было сделано при разработке системы EMYCIN на основе MYCIN.

1.4. Экспертные системы Практическим полем применения баз знаний являются экспертные системы (ЭС). Экспертная система – это система искусственного интеллекта, включающая знания об определенной слабо структурированной и трудно формализуемой узкой предметной области и способная предлагать и объяснять пользователю разумные решения. Экспертная система состоит из базы знаний, механизма логического вывода и подсистемы объяснений. Её основным компонентом является база знаний. База знаний – это семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом интеллектуальных и экспертных систем.
Для построения базы знаний необходим интеллектуальный редактор базы знаний. Интеллектуальный редактор базы знаний – это программа, предоставляющая инженеру по знаниям возможность создавать базу знаний в интерактивном режиме. Интеллектуальный редактор включает в себя систему шаблонов языка представления знаний, подсказки и другие сервисные средства, облегчающих работу с базой.
Основной режим работы экспертной системы – консультационный режим. Консультационный режим – это интерактивный режим эксплуатации базы знаний, при котором пользователь продвигается к решению задачи.
Вторым существенным компонентом ЭС является машина логического вывода или дедуктивная машина (или блок логического вывода, или решатель). Машина логического вывода – это программа, моделирующая механизм рассуждений и оперирующая знаниями и данными с целью получения новых данных из знаний и других данных, имеющихся в рабочей памяти. Обычно машина логического вывода использует программно реализованный механизм дедуктивного логического вывода или механизм поиска решения в сети фреймов или семантической сети.
Для контакта с пользователем ЭС должна обладать подсистемой общения и подсистемой объяснений. Подсистема общения – это программа:
— входящая в состав экспертной системы;
— служащая для ведения диалога с пользователем, в ходе которого ЭС запрашивает у пользователя необходимые факты для процесса рассуждения;
— предоставляющая возможность пользователю в определенной степени контролировать и корректировать ход рассуждений экспертной системы.
Подсистема объяснений – это программа, позволяющая пользователю получить ответы на вопросы:
— «Как было получено то или иное решение?»; обычно ответ на этот вопрос представляет собой трассировку всего процесса вывода решения с указанием использованных фрагментов базы знаний; и
-«Почему было принято такое решение?»; обычно ответ на этот вопрос есть ссылка на умозаключение, непосредственно предшествовавшее полученному решению.
Хорошо если ЭС обладает подсистемой приобретения знаний. Подсистема приобретения знаний – это программа, предназначенная для корректировки и пополнения базы знаний.
Подсистема приобретения знаний — в простейшем случае — интеллектуальный редактор базы знаний. Подсистема приобретения знаний — в более сложных случаях — средства для извлечения знаний:
— из баз данных;
— из неструктурированного текста;
— из графической информации и т.д.
ЭС создаётся и существует для пользователя. Пользователь – это проблемный специалист, для которого предназначена экспертная система. Считается, что квалификация пользователя недостаточно высока, и поэтому он нуждается в помощи и поддержке своей деятельности со стороны экспертной системы.
ЭС является системой, основанной на знаниях. Система, основанная на знаниях – это система искусственного интеллекта, в которой предметные знания представлены в явном виде и отделены от прочих знаний системы.

1.5. Визуальное проектирование баз знаний как инструмент обучения Визуальные методы спецификации и проектирования баз знаний и разработка концептуальных структур являются достаточно эффективным гносеологическим инструментом или инструментом познания. Использование ме­тодов инженерии знаний в качестве дидактических инструментов и в качестве формализмов представления знаний способствует более быстрому и более полно­му пониманию структуры знаний данной предметной области, что особенно ценно для новичков на стадии изучения особенностей профессиональной деятельности.
Методы визуальной инженерии знаний можно широко использовать в различ­ных учебных заведениях — от школ до университетов — как для углубления про­цесса понимания, так и для контроля знаний. Большинство учеников и студен­тов овладевают навыками визуального структурирования в течение нескольких
От понятийных карт к семантическим сетям
Было предложено определение поля знаний, которое позволяет инженеру по знаниям трактовать форму представления поля достаточно широ­ко, в частности семантические сети или понятийные карты (concept maps) являются возможной формой представления. Это означает, что сам процесс построения семантических сетей помогает осознавать познаватель­ные структуры.

Программы визуализации являются инструментом, позволяющим сделать види­мыми семантические сети памяти человека. Сети состоят из узлов и упорядочен­ных соотношений или связей, соединяющих эти узлы. Узлы выражают понятия или предположения, а связи описывают взаимоотношения между этими узлами. Поэтому разработка семантических сетей подразумевает анализ структурных взаимодействий между отдельными понятиями предметной области.
В процессе создания семантических сетей эксперт и аналитик вынуждены анали­зировать структуры своих собственных знаний, что помогает им включать новые знания в структуры уже имеющихся знаний. Результатом этого является более осмысленное использование приобретенных знаний.
Визуальные спецификации в форме сетей могут использоваться новичками и эк­спертами в качестве инструментов для оценки изменений, произошедших в их мышлении. Если согласиться, что семантическая сеть является достаточно пол­ным представлением памяти человека, то процесс обучения с этой точки зрения можно рассматривать как реорганизацию семантической памяти.
Kozma, один из разработчиков программы организации семанти­ческой сети Learning Tool, считает, что эти средства являются инструментами познания, усиливающими и расширяющими познания человека. Разработка се­мантических сетей требует от учеников:
·                   реорганизации знаний;
·                   исчерпывающего описания понятий и связей между ними;
·                   глубокой обработки знаний, что способствует лучшему запоминанию и извлечению из памяти знаний, а также повышает способности применять знания в новых ситуациях;
·                   связывания новых понятий с существующими понятиями и представлениями, что улучшает понимание;
·                   пространственного изучения посредством пространственного представления понятий в изучаемой области.
Полезность семантических сетей и карт понятий, пожалуй, лучше всего демонст­рируется их связями с другими формами мышления высшего порядка. Они тес­но связаны с формальным обоснованием в химии и спо­собностью аргументировать свои высказывания в биологии. Также было показано, что семантические сети имеют связь с выполнением исследований.
База знаний как познавательный инструмент
Когда семантическая сеть создается как прообраз базы знаний, разработчик дол­жен фактически моделировать знания эксперта. Особенно глубокого понимания ' требует разработка функциональной структуры.
Определение структуры ЕСЛИ-ТО области знаний вынуждает четко форму­лировать принципы принятия решения. Нельзя считать, что просто разработка поля знаний системы обязательно приведет к получению полных функциональ­ных знаний в данной области.
Разработка экспертных систем стала использоваться как инструмент познания сравнительно недавно. Lippert, который является одним из пио­неров применения экспертных систем в качестве инструментов познания, ут­верждает, что задания по созданию небольших базисов правил являются очень / полезными для решения педагогических проблем и структурирования знаний для учеников от шестого класса до взрослых. Изучение при этом становится более осмысленным, так как ученики оценивают не только сам процесс мышле­ния, но также и результаты этого процесса, то есть полученную базу знаний. Со­здание базы знаний требует от учеников умения отделять друг от друга факты, переменные и правила, относящиеся к связям между составляющими области знаний.
Например, Lai установил, что после того, как студенты-медики созда­дут медицинскую экспертную систему, они повышают свое умение в плане аргу­ментации и получают более глубокие знания по изучаемому предмету. Шесть студентов-первокурсников физического факультета, которые использовали экс­пертные системы для составления вопросов, принятия решений, формулировки правил и.объяснений относительно движения частицы в соответствии с законами классической физики, получили более глубокие знания в данной области благо­даря тщательной работе, связанной с кодированием информации и обработкой большого материала для получения ясного и связного содержания, а следователь­но, и большей семантической глубины.
Таким образом, создание базы знаний экспертной системы способствует более глубокому усвоению знаний, а визуальная спецификация усиливает прозрач­ность и наглядность представлений.
Когда компьютеры используются в обучении как инструмент познания, а не как контрольно-обучающие системы (обучающие компьютеры), они расширяют воз­можности автоматизированных обучающих систем (АОС), одновременно раз­вивая мыслительные способности и знания учеников. Результатом такого со­трудничества учащегося и компьютера является значительное повышение эф­фективности обучения. Компьютеры не могут и не должны управлять процессом обучения. Скорее, компьютеры должны использоваться для того, чтобы помочь ученикам приобрести знания.

2. Разработка курса «Инженерия знаний»   2.1. Анализ требований к содержанию курса с учётом заявленной цели Исследуя проблему представления за небольшое количество часов будущим учителям информатики темы «Инженерия знаний», необходимо иметь в виду цель такого изучения. Этот раздел можно считать очень важным именно для будущих учителей информатики по следующим причинам. С одной стороны учитель должен знать, как могут быть структурированы и представлены в формальном виде знания, которые мы традиционно привыкли видеть представленными в виде текстов на естественном языке, или в виде знаний, умений и навыков конкретных людей. С другой стороны особенно важно будет для будущего учителя познакомиться с методами извлечения знаний из эксперта альтернативные педагогическим методам «извлечения знаний из учащегося». Всё это позволит будущему учителю с одной стороны углубить своё понимание в области формирования и приобретения знаний обучаемым, а с другой – даст ему возможность расширить свой педагогический арсенал приёмами выявления и структуризации знаний, применяемыми в инженерии знаний.
Поэтому необходимо разработать курс по выбору по теме «Инженерия знаний» такой, что его изучение позволит обучающимся по специальности «учитель информатики» получить адекватное представление о современном состоянии данного раздела информатики. При этом необходимо избежать излишних технических подробностей.

2.2. Содержание курса Изучая построение курса, выделим темы, подлежащие изучению.
Во-первых, необходимо рассмотреть основы инженерии знаний. В данном разделе надо раскрыть следующие понятия: данные и знания, базы знаний, основные сферы применения баз знаний – экспертные системы, структура и классификация экспертных систем, этапы разработки экспертных систем, коллектив разработчиков экспертных систем.
Далее необходимо рассмотреть теоретические аспекты извлечения знаний. В данном разделе надо раскрыть следующие понятия: стратегии получения знаний, психологический аспект, лингвистический аспект, гносеологический аспект.
Следующая тема – когнитивная психология в инженерии знаний. В данном разделе надо раскрыть следующие понятия: основы когнитивной психологии, семантическая репрезентация знаний, образная репрезентация, восприятие информации, организация памяти.
Основные темы курса начинаются с темы «методы извлечения знаний». В данном разделе надо раскрыть следующие понятия: классификация методов, пассивные методы, активные индивидуальные методы, активные групповые методы, экспертные игры, текстологические методы.
Далее идёт тема «методология структурирования знаний». В данном разделе надо раскрыть следующие понятия: поле знаний, стадии структурирования, методы структурирования, психосемантика и методы многомерного шкалирования.
Следующая тема – машинно-ориентированные приобретение и формирование знаний. В данном разделе надо раскрыть следующие понятия: автоматическое формирование знаний, системы автоматического формирования знаний.

2.3. Тематическое планирование и рабочая программа курса Цель и задачи курса
Цель – дать студентам систематическое представление о возможностях современных методов извлечения и представления знаний для ориентирования в современных информационных технологиях, и проведения аналогий с приобретением знаний у учащихся. Задача – дать студентам умения работы со знаниями, их извлечения и структуризации.
    продолжение
--PAGE_BREAK--


Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.