Реферат по предмету "Психология, педагогика"


Разработка компьютерной языковой системы обучения японскому письму с использованием техники обработки естественного языка

:Изучение страдательного залога.
Jie Chi YANG, KanjiAKAHORY
Эта работа описывает разработку компьютерной языковойсистемы обучения (computer assisted language learning system– CALL-система)японскому письму с использованием техники обработки естественного языка (natural language processing – NLP–техника).Эта система может быть использована при письме для изучения японскогострадательного залога с помощью WWW. Для выявления типов ошибок, возникающих при написаниистрадательного залога японского языка у студентов-иностранцев, авторы проводилитест и делали обзор вопросника. В результате этих исследований авторыклассифицировали типы ошибок в японском страдательном залоге на 12 категорий,65 видов и 228 ошибок. Эта классификация используется для анализа ошибок,проводимого системой. В этой системе авторы используют средства NLP(включая анализатор морфем и синтаксический анализатор), а затем добавляютанализ ошибок и обработчик обратной связи. Таким образом, система, даваяобучаемому возможность свободно вводить предложения, может обнаружить ошибку внапечатанных (введенных обучаемым с клавиатуры) предложениях и выдаватьобучаемому адекватные сообщения обратной связи. Кроме того, авторы предлагаютмеханизм исправления обучаемым, позволяющий обучаемому корректироватьнапечатанные предложения самому, что поможет ему лучше понять те ошибки,которые он совершил. Этот механизм может быть рассмотрен как дополнение к блокупрогнозирования системы и как усиление эффективности данной CALL-системы.
Введение
Эффективность CALL-систем была описана многими учеными[4],[7]. Недостатком существующих CALL-систем является то, что обучаемый неможет свободно вводить с клавиатуры заданные языковые выражения, особенно этоотносится к компьютерным системам обучения письму. Обучаемому доступна лишьинформация, сопровождающая правила учебного курса, заранее установленного накомпьютер. Поэтому нельзя назвать такой тип систем полностью интерактивными. Врезультате этих причин проводится все больше и больше исследований [1],[3],[7]вобласти применения NLP-техники в CALL-системах. Исследования [2],[5],[9]анализа ошибок в системах обучения письму были особенно усилены превосходнымирезультатами эксперимента [6] в области выносливости (устойчивости к ошибкам)средств NLP.
В CALL-системах анализ напечатанных предложенийявляется необходимостью, так как обучаемый должен иметь возможность свободноформулировать предложения без каких-либо предописанных правил. Поэтому мыиспользуем средства NLP для анализа напечатанных предложений.
К сожалению, почти все теории грамматики и техникаNLP, предложенные до сегодняшнего дня могут анализировать только грамматическикорректные предложения. Однако обучаемые японскому языку, использующиеCALL-систему, скорее всего, напечатают неправильные предложения. Таким образом,мы можем или добавить анализатор ошибок в существующие, нескорректированныеNLP-средства, или скорректировать NLP-средства для решения этой проблемы. Вэтой статье мы применили первый метод. Однако, это сопряжено с проблемойнеопознания правильной морфемы или правильной части речи слова. Трудностьзаключается в обнаружении правильных морфем даже в грамматически корректныхпредложениях, так как в японском языке предложения пишутся непрерывно, без каких-либопромежутков1. Поэтому в случае неправильно введенных предложений онибудут интерпретированы как грамматически корректные. Неправильная морфема будетпризнана правильной существующими средствами NLP. Например, правильноепредложение с правильными морфемами «Jyon san wa kaku san ni nagura remashita.» (Джон ударен мистером Каку) будет анализировано как «Jon san wa kakusan nina kura re mashita.» (Джон перевернут мистером Каку), если правильноеслово «naguraremashita» будет введено как неправильное слово «inakuraremashita».Вот, почему мы представляем разработанную систему. Настоящая система можетобнаруживать правильные морфемы, даже если было введено неправильноепредложение.
В нашей системе мы использовали метод, которыйпрогнозирует структуры неправильного ввода, а затем сохраняет их с цельюанализа ошибок. Другими словами, он сводится к исследованию возможных структурнекорректных предложений в страдательном залоге, логически вытекающих изпонимания правил определения корректности предложений.
Настоящая работа описывает CALL-систему, использующуюNLP-технику, которая может помочь устранить недостатки существующихCALL-систем. Представленная система позволяет обучаемому свободно вводить склавиатуры предложения, она может обнаруживать ошибки в напечатанныхпредложениях и выдавать обучаемому адекватные сообщения обратной связи и можетбыть использована для обучения написанию японского страдательного залога спомощью любого WWW браузера.
Структура и реализация системы
2.1.Cхема и алгоритм системы
На рисунке 1 изображена схема системы. Система состоитиз интерфейса, то есть, WWW браузера, системы анализа предложений, системыобратной связи, словаря и грамматических правил. Система анализа предложенийвключает в себя анализатор морфем (JUMAN 3.0), синтаксический анализатор (KNP1.1) и анализатор ошибок. Средства NLP – JUMAN и KNP – были разработанылабораторией Нагао университета Киото (Япония). Эти средства могутанализировать только грамматически корректные японские предложения. Системаобратной связи включает в себя генератор сообщений обратной связи, базу знанийи истории всех обучаемых, работавших с системой. Кроме того, в системеиспользуются электронные словари EDR1.52, IPAL3 и Bunruigoi hyou4.
Перед началом использования системы необходимарегистрация, включающая в себя указание имени обучаемого и опыта изучения имяпонского языка. После регистрации обучаемый управляет системой в соответствиис инструкциями, написанными на каждой Web-странице. Страницы обучения состоятиз большого количества картинок, которые могут быть выбраны обучаемым. Когдаобучаемый выбирает одну из них, то загружается новой страница с увеличеннойкопией картинки и текстовым окном под ней. Затем обучаемый может нагляднопросмотреть картинку и ввести по-японски предложение в страдательном залоге втекстовом окне. Текст может вводиться в буквах обоих алфавитов («канджи» или«кана») японского языка, как это принято в большинстве японских текстовыхредакторов. Таким образом, система выдает обучаемому адекватные сообщенияобратной связи в соответствии с введенными фразами, если были обнаруженыкакие-либо ошибки.
Сноски:
Однако выражения на «ромайи» (романский (латинский)алфавит японского языка) пишутся с пробелами между словами. В случае «ромайи»идентифицировать правильное или неправильное предложение не составит труда.
EDR1.5:Japan Electronic Dictionary Research Institute, Ltd — Исследовательский Институт Электронных Словарей).
IPAL:IPA (The Information-technology Promotion Agency) Lexiconof Japanese Language for computers. — (Агентство Развития Информационных Технологий)Лексикон Японского Языка для компьютеров.
Bunrui goi hyou: один из тезаурусов издательства Syuuei publication, Токио.
Алгоритм системы:
Обучаемый печатает по-японски предложение.
Напечатанное предложение анализируется «СистемойАнализа Предложений», включающей в себя анализатор морфем (JUMAN),синтаксический анализатор (KNP) и анализатор ошибок.
Код ошибки, определенный системой анализа предложений,посылается системе обратной связи.
/>
Если была ошибка, система заставляет обучаемогоисправить ее с повторением всех шагов.
Рисунок 1 Схема системы
Система обратной связи и исправление обучаемым
Информация об ошибках поступает на систему обратнойсвязи от системы анализа предложений в виде кода ошибки. Адекватные сообщенияобратной связи выдаются в соответствии с кодом ошибки. В этой системе авторыпредлагают механизм исправления ошибок обучаемым, позволяющий обучаемому лучшепонять те ошибки, которые он совершил. «Исправление обучаемым» означает, чтокогда анализатор ошибок обнаруживает ошибку, обучаемому выдается не готовыйответ, а соответствующее введенному предложению сообщение обратной связи.Обучаемый может или прочитать сообщение обратной связи сразу и исправитьвведенное предложение, или он может обратиться к грамматическим темам,освещающим его ошибку и исправить предложение позже. Сообщения обратной связи скаждым исправлением становятся более детальными. Например, если это ошибка вспряжении глагола, то будет выдано примерно такое сообщение обратной связи«Ошибка в глаголе», и несколько примерно таких ссылок «Таблица глаголов»,«Практика спряжения глаголов», «Что такое страдательный залог» и т.п. — внизусообщения. Обучаемый может обратиться к этим грамматическим темам и исправить ошибкусамостоятельно. Конечно же, предложение можно исправить и непосредственно послевыдачи сообщения обратной связи.
Рисунок 2 иллюстрирует сообщения обратной связи онеправильном спряжении глагола в страдательном залоге.
/>
Рисунок 2. Сообщение обратной связи онеправильном спряжении глагола в страдательном залоге.
Заключение
В этой работе авторы описывают разработку CALL-системы,основанной на средствах NLP, целью которой является обучение страдательномузалогу японского языка. Эта система позволяет обучаемому свободно вводить склавиатуры предложения по-японски и может обнаруживать ошибки в напечатанныхпредложениях и обеспечивать обучаемому выдачу адекватных сообщений обратнойсвязи. Обучаемый может использовать эту систему где угодно и когда угодно, таккак эта система запускается на любом WWW-браузере. Таким образом этотподход может быть рассмотрен как новый метод в обучении языку (особеннояпонскому языку в нашем случае). Как уже было описано, мы не используемсуществующие средства NLP в том виде, в котором они есть. Вместо этого мыприменяем анализатор ошибок для анализа неправильно введенных предложений.Кроме того, мы используем метод, прогнозирующий структуры неправильного ввода исохраняющий их внутри системы для анализа ошибок. С этой целью авторы проводилиобзор для выявления типов ошибок, возникающих при написании страдательногозалога японского языка у студентов-иностранцев. Хотя это и утомительная работа,но она помогает в накоплении данных об ошибках, которые могут быть позднееиспользованы для анализа ошибок.
Мы планируем расширения системы, например: увеличениебазы ошибок, различные сообщения обратной связи разным людям и более гибкиеправила анализа ошибок при использовании словаря понятий EDR.
Список литературы
1.Holland, V.M., and Kaplan, J.D. (1995).Natural Language Processing Techniques in Computer Assisted Language Learning:Status and Instructional Issues. Instructional Science, 23, 351-380.
2.Juozulynas, V. (1994). Errors in theCompositions of Second-Year German Students: An Empirical Study forParser-Based ICALI. The CALICO Journal, 12(1), 5-15.
3.Loritz, D. (1992). Generalized TransitionNetwork Parsing for Language Study: The GPARS System for English, Russian,Japanese and Chinese. The CALICO Journal, 10(1), 5-22.
4.Lam, F.S., and Pennington, M.C. (1995).The Computer vs. the Pen: A Comparative Study of Word Processing in a Hong KongSecondary Classroom. Computer Assisted Language Learning, 8(1), 75-92.
5.Lee, K.K., Konishi, T., Takagi, A.,Shirai, K., and Ohara, H. (1994). Composition Error Analysis and AdviceStrategy Using a New Japanese-Korean Composition Training ICAI System.Transactions of Information Processing Society of Japan, 35(7), 1223-1234. InJapanese.
6.Matsumoto, Y., and Imaichi O. (1994).Current Issues in Robust Natural Language Processing. In Proceedings of theFirst SIG-SLP Conference of the Information Processing Society of Japan. InJapanese.
7.McEnery, T., Baker, J.P., and Wilson, A.(1995). A Statistical Analysis of Corpus Based Computer vs. Traditional HumanTeaching Methods of Part of Speech Analysis. Computer Assisted LanguageLearning,
8(2-3), 259-274. 8.Nagao, M. (1996).Natural Language Processing. Tokyo: Iwanami syoten. In Japanese.
9.Nagata, N. (1995). An effectiveApplication of Natural Language Processing in Second Language Instruction. TheCALICO Journal, 13(1), 47-67.
10.Yamamoto, H., Sakayauchi, M., andYoshioka, R. (1996). Development System of Japanese Teaching Material UsingCASTEL/J. In Proceedings of the 20th Annual Conference of the Japan Society forScience Education, 105-106. In Japanese.
11.Yang, J.C., andAkahori, K. (1997). Development of Computer Assisted Language Learning Systemfor Japanese Writing Using Natural Language Processing Techniques: A Study onPassive Voice. In Proceedings of the 8th World Conference on ArtificialIntelligence in Education (AI-ED97).


Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.