Конспект лекций по предмету "Проектирование интерфейсов"


Тема 4. Интерфейсы информационного взаимодействия.

Лекция 11.Анализ и синтез естественного языка взаимодействия. Структурная схема лингвистического транслятора. Морфологический анализ (синтез). Синтаксический анализ (синтез). Семантическая интерпретация (синтез) и проблемный анализ.
Цель анализа предложений естественного языка (ЕЯ) заключается в их переводе на машинный язык (МЯ) вычислительной системы. Этот процесс можно представить наглядно в виде следующей схемы (рис11).

Структурная схема лингвистического транслятора
Рисунок 11.
Задача анализа ЕЯ сводится к:
- распознаванию правильно построенных предложений ЕЯ;
- исправлению ошибок в ЕЯ -тексте;
- декомпозиции предложения на Фрагменты и построению его син­таксической структуры;
- семантической интерпретации фрагментов ЕЯ во фрагменты М-языка;
- композиции фрагментов М-языка в структуру, описывающую си­туацию проблемной среды.
Задача синтеза ЕЯ заключается в:
- определении информации, которую необходимо сообщить пользо­вателю;
- разбиении текста М-языка на фрагменты, соответствующие бу­дущим фразам;
- определении лексем для синтезируемой фразы;
- построении синтаксической структуры фразы;
- определении порядка слов и осуществлении морфологического синтеза словоформ.
Морфологический анализ (синтез).
Цель морфологического анализа - построение для каждой сло­воформы предложения списка пар (х,у), где х - лексема или осно­ва данной единицы, а у -подсписок значений грамматических при­знаков, определяющих данную словоформу (например, идут занятия);
идти - глагол, множественное число, настоящее время;
занятие - существительное, средний род, множественное число, именительный падеж.
Существуют два основных метода морфологического анализа:
- декларативный, когда в словаре системы хранятся все возмож­ные словоформы с coответствующим комплексом морфологической ин­формации;
- процедурный, когда наряду со словарем, в котором хранятся только основы слов, система имеет набор правил словообразования, позволяющих анализцровать словоформу и приписывать ей соответст­вующий комплекс информации.
Морфологический синтез предназначен для построения конкрет­ных словоформ ЕЯ по словарю и заданной морфологической информа­ции. Аналогично ананализу морфологический синтез реализуется дек­ларативным и процедурным способами.
Синтаксический анализ (синтез).
Задача синтаксического анализа - построение синтаксической структуры предложена на основе морфологической информации и синтаксических правил объединения слов и словосочетаний. Синтак­сическая структура отражает связи, существующие между словами предложения. Известны два основных способа описания синтаксиче­ской структуры - система составляющих и дерево зависимостей.
Система составляющих. Пусть имеется цепочка х (произволь­ная последовательность словоформ) длиной w (количество словоформ) . Каждая словоформа цепочки называется точкой. Для любых точек a и b цепочки х таких, что а < b (а левее b) вводится понятие отрезка, представляющего множество точек s, удовлетворяющих неравенству а < s < b . Множество S отрезков цепочки х называется системой составляющих этой цепочки, если
- множество S содержит отрезок, состоящий из всех точек це­почки х, либо все одноточечные отрезки цепочки;
- любые два отрезка из множества b либо не пересекаются, либо один из них содержится в другом.
Элементы S называются составляющими. Например, для пред­ложения "лекция проводится в аудитории номер 232 главного корпу­са" допустима следующая система составляющих (рис.12): -
Рисунок 12. Система составляющих предложения
Дерево зависимостей. Пусть х - произвольная непустая це­почка и X - множество всех точек х. Произвольное бинарное отношение R, определенное на X, при котором направленный граф (X,R) является деревом, называется отношением зависимости. Само дерево (X,R) называется деревом зависимостей для X. Если меж­ду точками а и b существует отношение а->b, то точку а на­зывают управляющей, а b - подчиненной (рис.13).
Рисунок 13. Дерево зависимостей предложения
Целью синтаксического синтеза является формирование синтак­сической структуры фраз и заполнение их соответствующими лексемами. Заключительным шагом синтеза является приписывание лексе­мам морфологических характеристик.
Семантическая интерпретация (синтез) и проблемный анализ.
Цель семантической интерпретации - формирование фрагментов на М-языке, соответствующих описанию проблемной ситуации. Полу­чение таких фрагментов осуществляется на основе фрагментов ЕЯ-предложения, представленных в синтаксической структуре. Получе­ние фрагментов М-языка предполагает добавление в них информации, которая выражена неявно в ЕЯ-пррдложении. На этапе проблемного анализа множество фрагментов проблемной ситуации структурируется с помощью правил описания ситуаций в проблемной среде. В резуль­тате этого получается структура описания ситуации, заданной ЕЯ-текстом, которая затем подается на вход ВС (рис.14).
Рисунок 14. Семантическая сеть предложения

Семантический синтез заключается в преобразовании текста М-языка таким образом, чтобы его части могли бы соответствовать будущим фразам и предложениям ЕЯ. Такое преобразование осущест­вляется за счет фрагментирования текста М-языка.


Не сдавайте скачаную работу преподавателю!
Данный конспект лекций Вы можете использовать для создания шпаргалок и подготовки к экзаменам.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем конспект самостоятельно:
! Как написать конспект Как правильно подойти к написанию чтобы быстро и информативно все зафиксировать.