Многоязычный текстовый процессор Accent
Введение
Практически каждый пользователь компьютера встречается с необходимостью
подготовки тех или иных документов - писем, статей, служебных записок, отчетов и
т.д. - на каком-либо иностранном языке. И почти каждому пользователю, если у
него нет соответствующей программы-перехода или шрифта, не удается это сделать.
Первые текстовые редакторы разрабатывались в расчете на работу с английским
языком, и набор разрешенных к использованию алфавитных символов ограничивался в
них стандартной латиницей. Современные программы подготовки документов умеют
справляться с неанглийским текстом, но из одноязычных они превратились
всего-навсего в двуязычные: как правило, для каждой страны создается специальная
адаптированная версия, обеспечивающая работу с соответствующим языком, а также с
английским. Подключить еще один язык (чтобы, например, вставить в русский текст
одну-две фразы по-немецки или по-голландски) в большинстве случаев возможно
(если найдутся соответствующие шрифты), но не всегда просто.
Такое положение особенно неприятно для переводчиков, лингвистов, составителей
деловой корреспонденции на другом языке и тех, чья работа в той или иной мере
связана с обработкой иностранных текстов. Да и в самой нашей республике имеется
проблема редакторов с якутским языком, иногда чтобы набрать текст на родном
языке приходится переключаться то на английский, то на кириллицу, то писать все
время вместо буквы 5 цифру 5, но эффект остается все равно низким.
В моем реферате речь пойдет о текстовом процессоре, который проектировался как
многоязычный с самого начала.
1. История создания ACCENTа
Пакет называется ACCENT, по-русски - “АКЦЕНТ” (подразумевается не иностранный
акцент, а надстрочный знак ударения); его производитель - израильская компания
Accent Software, чьей первой разработкой была “двунаправленная” (bidirectional)
версия Windows, в которой курсор может автоматически двигаться не только слева
направо, но и справа налево - в соответствии с направлением письма в иврите и
арабском. В дальнейшем компания стала специализироваться на программах
подготовки многоязычных документов - продуктах LanguageWare.
В 1992 г. Accent Software выпустила текстовый процессор “Дагеш” (дагеш -
примерно соответствующий акценту по начертанию и использованию знак еврейского
письма) для “двунаправленной” Windows, поддерживающий четыре языка: иврит,
арабский (государственные языки Израиля), английский и русский. А так как в
определенном смысле все что больше двух, - это уже много, программа,
манипулирующая четырьмя языками должна быть основана на технике, позволяющей
работать с любым их числом. И в 1994г. выходит пакет Accent 1.0, обеспечивающий
создание документа на трех с лишним десятках европейских языков (с вариантами по
странам).
В марте 1995 г. появляется версия Accent 2.0, где набор языков еще расширен; в
частности, добавлен иврит и арабский (для обычных не “двунаправленных” вариантов
Windows проблему курсора потребовалось решить заново). В моем реферате речь
пойдет о версии 1.1 (с которой я сам однажды работал), от ноября 1995г. (более
модернизированной версии 1.0) и о версии 2.0, более профессиональной и
громоздкой, на которой основаны все последующие пакеты Accent, и которая, как я
думаю, более распространена среди российских переводчиков-пользователей.
2. Многоязычные документы
Итак, “Акцент” - текстовый процессор для Windows, который обеспечивает работу с
многоязычными документами. Идея многоязычного документа проста и изящна: признак
языка делается стилевым атрибутом символа - как бы еще одной шрифтовой
характеристикой вроде кегля или способа выделения. Соответственно в зависимости
от текущего языка перенастраиваются такие параметры обработки текста, как
проверка правописания и расстановка переносов. Среди атрибутов имеется и цвет,
так что текст можно “раскрасить” в зависимости от языка.
Все поддерживаемые языки обеспечены шрифтами True Type и раскладками клавиатуры,
что крайне полезно при работе на неродном языке; если для какого-то языка
существуют разные раскладки, “Акцент” это учитывает - в частности, предусмотрено
несколько русских клавиатур. Дополнительные языково-зависимые функции
редактирования (они созданы не в самой Accent Software, а являются
лицензированными продуктами независимых разработчиков) реализованы пока лишь для
части языков (см. таблицу); проверка правописания - для 17, расстановка
переносов - для 13, словарь синонимов - для 9, многоязычный переводной словарь -
для 5. Понятно, что расширение набора этих функций - проблема скорее
организационная, чем техническая. Конечно, новые словари потребуют
дополнительного дискового пространства, но ведь можно установить пакет и не
целиком. Минимальная конфигурация “Акцента” занимает на диске 6 Мбайт, полная 22
Мбайт (для Accent 1.1).
Таблица. Языки AccentЯзыкРабота с текстомИнтерфейс
Проверка правописанияРасстановка переносовСловарь синонимовМенюВстроенная
документацияПечатная документация
албанский
английский (американский)++++++
английский (британский)+++
арабский*
белорусский
болгарский
венгерский+*
голландский++++*
греческий+
датский++*
иврит*
исландский
испанский++++++
испанский (латиноамериканский)+
итальянский++++++
каталонский
молдавский (латиница)
немецкий++++++
немецкий (швейцарский)+
норвежский+++
польский
португальский+++
португальский (бразильский)+
румынский
русский++++
сербский
словацкий
словенский+
турецкий+
украинский
финский++++
фламандский
французский++++++
французский (канадский)+
хорватский+
чешский+
шведский++++
+ - имеется в Accent 1.1.
* - только в Accent 2.0.
Закрепление за каждым отрывком текста своего языка накладывает определенные
ограничения; так, в “Акценте” не поддерживается поиск фрагментов, содержащих
символы из алфавитов разных языков (наподобие постоянно встречающихся в
русскоязычных компьютерных изданиях “Windows-программа”, “EXE-файл”,
“OLE-объект” и т.п.) Тем самым за многоязычие приходится платить отказом от
некоторых удобств, автоматически представляемых практически всеми
“англо-русскими” редакторами; в таком положении оказываются все, кто пишет на
языках с алфавитом на нелатинской основе.
Интересной основой “Акцента” является автоматическое переключение текущего
набора атрибутов; если щелкнуть кнопкой мыши, когда I-образный указатель
находится на каком-нибудь символе, атрибуты этого символа делаются текущими
(позиция ввода оказывается слева или справа от символа в зависимости от того, на
какой его половине стоял указатель). К автоматическому переключению необходимо
приспособиться - тому, кто привык к другим текстовым процессорам для Windows ,
оно, возможно будет поначалу мешать; действительно пытаешься всего-навсего
изменить позицию ввода, а впридачу меняются шрифт, раскладка клавиатуры и т.д.
Но когда приходится часто переходить с языка на язык (или, скажем, с курсива на
прямой шрифт и обратно), это позволяет сэкономить массу времени.
Также особой характеристикой Accent является встроенная программа-переводчик
(профессиональная версия), который обеспечивает перевод около 20 языков. Нельзя
сказать, что перевод безупречный по сравнению с другими программами (Stylus,
Socrat и т.д.), но для непосредственного перевода некоторых незнакомых слов он
незаменим.
3. Управление языком интерфейса
Многоязычным сделан и интерфейс “Акцента”; для выбора языка меню предусмотрена
специальная кнопка с изображением глобуса, при переключении меню автоматически
меняется и язык встроенной документации (если имеется соответствующий файл).
Меню существуют на 15 языках (в Accent 2.0 к ним добавились еще 4), встроенная
документация - на 8 (в Accent 2.0 - на 9). Русский среди них есть, так что в
русификации “Акцент” не нуждается.
Очень удобно, что не нужно переключать режим клавиатуры, когда при работе с
русским текстом требуется ввести имя файла: в поле имени автоматически вводится
латиница. Правда, чтобы выбрать пункт русскоязычного меню по букве (+Ф -
“Файл”, +Р - “Редактирование” и т.д.), придется-таки включить стандартный
драйвер кириллицы (кстати, это единственное, для чего он может понадобиться в
“Акценте”), и тогда имена вводиться перестанут.
Что касается русскоязычной документации, то ее качество, пожалуй, не хуже, чем у
большинства русифицированных западных пакетов. И хотя некоторые термины
отличаются от принятых в России - скажем, “унаследование” или “равномерный
шрифт” вместо “наследование” и “моноширинный шрифт”, - это не слишком затрудняет
понимание.
4. Другие характеристики
По сравнению с Word for Windows, например, “Акцент” попроще - нет встроенного
Бейсика, функций редактирования графиков, формул и изображений, возможности
оформления текста примерно такие же. Пакет предоставляет относительно бедные
средства работы с таблицами, но в версии 2.0 положение исправлено. Есть шаблоны,
печатать со слиянием (print merge - “совмещенная печать” в терминологии
“Акцента”) и т.д. Вообще Accent является исключительно текстовым редактором, так
что навороты, которые предоставляют другие редакторы практически исключены.
Сильной стороной рассматриваемого продукта является и то, что “Акцент”
обеспечивает импорт и экспорт документов в форматах Lotus 1-2-3, WordStar,
AmiPro, Excel 4 и 5 (их однако можно только читать), Word для DOS 3-6, Word for
Windows 1-6, WordPerfect 5.1, WordPerfect for Windows, WordPerfect 4-6 для DOS,
Write 3.0, а также ASCII-текстов (с разбивкой на строки и без) и RTF-текстов. И
этот список далеко не полон, приведены только наиболее распространенные форматы.
Предусмотрена вставка в документ изображений форматов BMP, TIFF, GIF, PCX, EPS и
WMF.
Единственная сложность может возникнуть при работе со стилями. Необходимо будет
определить и назвать стили в Accent так же, как они называются в том программном
продукте, куда будет экспортироваться документ.
Конвертирование в форматы и из форматов DOS-программ учитывает соответствие
национальных кодовых страниц для DOS и Windows (естественно, при экспорте
многоязычного текста придется выбрать что-то одно).
Нельзя сказать, чтобы импорт и экспорт всегда проходили абсолютно гладко. К
примеру, экспортировать в ASCII-формат русский текст удалось только для трех
кириллических шрифтов, поставляемых с “Акцентом” - остальные (инсталлированные
независимо) программа конвертировать отказалась. В экспериментах с Word for
Windows бывало, что “ехали” таблицы, выключенный текст превращался в
центрированный и т.д. (все это, разумеется, несложно поправить вручную). Надо
заметить, что от мелких погрешностей такого рода не свободен ни один из
существующих текстовых процессоров со сколько-нибудь развитыми функциями импорта
и экспорта, а в случае “Акцента” задача сложнее - ведь необходимо обеспечить
правильную работу этих функций сразу для всех национальных вариантов
поддерживаемых форматов. Важным достоинством документации является то, что она
честно предупреждает пользователя о возможных трудностях и советует, как их
преодолеть.
“Акцент” можно использовать в сети - очень удобно для бюро переводов,
издательства, выпускающего литературу на нескольких языках, или просто фирмы,
имеющей партнеров в разных странах. При сохранении документа на диске его можно
зашифровать, а также сжать; степень сжатия существенно зависит от доли
нетекстовой информации (элементов шрифтовой разметки, иллюстраций), но чаще
всего оказывается примерно вдвое ниже, чем при упаковке универсальным
архиватором (ARJ, LHA, PKZIP).
5. О том, чего нет и что возможно будет
С точки зрения переводчиков-профессионалов, в “Акценте” есть, наверное, все,
чего только можно желать. Но если выйти за рамки деловой переписки и технической
документации, обнаружится, что некоторые вещи все же отсутствуют. Так,
применительно к русскому языку “Акцент” не оправдывает своего названия - он не
позволяет набрать акцентуированный русский текст (то есть текст, в котором
проставлены ударения). В результате “Акцент” оказывается непригоден для
подготовки такой важной разновидности многоязычных текстов, как учебники и
общеязыковые словари. (Проблема, разумеется, не является “чисто русской” -
специальные символы и значки используются в учебных текстах и словарях многих
языков).
О необходимости диакритик (надстрочных и подстрочных знаков) для европейских
алфавитов, по-видимому, просто забыли, - скорее всего, из-за того, что буквы с
диакритиками имеются в стандартных шрифтах. Принципиальной же сложности,
насколько можно судить со стороны, здесь нет - ведь “Акцент” позволяет
огласовать арабский текст (в арабском гласные обозначаются диакритиками, причем
это делается примерно в тех же разновидностях текстов, в каких по-русски
проставляются ударения). Возможно, Accent Software добавит такую возможность в
одной из следующих версий.
Практически полностью отсутствуют средства верстки, которые реализованы во
многих программных продуктах начального уровня. Например, фрагмент текста,
таблицу или графический объект нельзя забрать в кадр, обтекаемый основным
текстом. Остается только размещать эти объекты во всю ширину листа, что ухудшает
внешний вид документа и усложняет его читаемость. Впрочем, многие полагают, что
при конторском или домашнем использовании текстовых процессоров эти функции
обычно ненужны. К тому же их реализация требует значительного расхода ресурсов,
что тормозит машину и чревато зависанием или аварийным завершением программы.
Недостатком Accent является, пожалуй, и то, что иконки на кнопках очень далеки
от интуитивной понятности.
Также хотелось бы чуть-чуть “приоткрыть” интерфейс программы - так, чтобы можно
было добавить к списку языков новый язык и определить для него группу шрифтов и
раскладку клавиатуры, то есть составить другой алфавит, используя буквы из
разных. Хотя такие планы уже рассматриваются в Accent Software и, возможно, что
Accent Software уже сейчас создал данный сервис. Это позволит пользователю
формировать нестандартные наборы символов и работать с ними. Ведь у
разработчиков, наверное, еще не очень скоро дойдут руки до таких языков, как
якутский или абхазский (при том, что готовые шрифты для них уже существуют), а
при данном сервисе пользователь без проблем составит свой алфавит.
В ближайших планах компании - подключение новых языков с принципиально иными
системами письма: хинди, японского и двух вариантов китайского. И если хинди -
все-таки язык с алфавитной письменностью (правда, гласные обозначаются
диакритиками, а сочетания согласных сливаются в единые сложные знаки -
лигатуры), то китайцы и японцы, как известно, пользуются иероглифами. Здесь
разработчикам потребуется организовать работу с большими (из нескольких тысяч
элементов) наборами символов, в частности реализовать ввод этих символов.
Объявлен и возможно осуществлен новый многоязычный проект Accent Software с
кодовым названием Scotty. Его цель - создание почтовой утилиты, позволяющей
посылать по сети Internet тексты на разных языках. Для пересылки предполагается
использовать разработанный фирмой BitStream формат TrueDoc, в котором в сжатом
виде представлен как собственно текст, так и информация о шрифтах.
Продукт будет состоять из двух частей - Reader и Writer - соответственно для
чтения и написания корреспонденции. При этом Accent Software планирует
распространять Reader бесплатно, а Writer встраивать в свои продукты и продавать
лицензии на эту программу независимым разработчикам и организациям,
предоставляющим сетевой сервис. И может быть скоро мы будем посылать в Америку
письма на своем родном языке с помощью Accent-а, не заботясь о том, какая у
получателя машина и операционная система.
6. Требуемые ресурсы и условия использования
Минимальная конфигурация компьютера, на которой будет работать Accent 1.1, -
286-й процессор или выше, 4 Мбайт оперативной памяти; 3,5 Мбайт свободного
дискового пространства, видеосистема VGA или выше, Windows 3.1 или новее. Но для
нормальной работы нужен все-таки быстрый 386SX, а лучше DX/33 или 40. На 386-й
машине с 4 Мбайт памяти Accent трудится вполне приемлемо, особенно если в
документе нет графических объектов. В этом случае скорость работы даже можно
назвать комфортной. Тем более что у Accent гораздо меньше недостатков и
неприятных особенностей, связанных с плохой отладкой, чем у продуктов с громкими
именами. К тому же многие функции, использование которых здорово тормозит
машину, в Accent не реализованы. Не следует устанавливать и поддержку большого
количества языков, что может также сильно замедлять работу. Двух-трех будет
вполне достаточно. В такой конфигурации Accent займет на диске 7-9 Мбайт. Но а
полная конфигурация (с установкой инструментария для всех поддерживаемых языков
и переводчика) составляет 37 Мбайт.
Текстовый процессор Accent - коммерческий продукт. Облегченная версия с
поддержкой двух-трех языков стоит 70 долларов, а полная, куда входит
автоматический переводчик и поддержка 50 языков, почти 400 долларов. Существуют
и другие релизы стоимостью от 140 до 300 долларов. Рабочую демо-версию можно
списать из Интернета, с сайта http://www.download. com или
http://www.accentsoft.com. Кроме того, дистрибутив Accent можно встретить и на
некоторых CD-дисках с бесплатными и условно бесплатными программами.
Заключение
Текстовый редактор, который я рассмотрел является многоязычным. Он несомненно
будет нужен в будущем для студентов из отделения мировой экономики для
составления деловой корреспонденции и подготовки документов на иностранных
языках. Ведь международные отношения нашей республики все время расширяются,
появляются новые страны-партнеры с более сложным алфавитом (Китай, Япония,
Корея) и автоматически выходит на первый план проблема переписки. Рассмотренный
мной процессор с его скоростью обновления как раз решает эту проблему.
С увеличением сети Интернет по всему миру появляется также проблема связи
“читатель - пишущий” (мы не можем прочитать информацию на русском, посылаемую из
России, например, во Франции) которую также решит Accent.
Также, возможно, он снимет задачу составления локальных алфавитов и языковых
стилей непосредственно в любом месте. Действительно, очень непросто напечатать
якутский текст на простом редакторе (проблема, которая также касается многих
народов, особенно из бывшего СССР). Хотя, конечно, рядовой пользователь может
составить якутский текст в другом редакторе, например, в известном “Лексиконе”,
если загрузить соответствующий якутский шрифт (они очень редко, но встречаются
на дискетах), или в том же Word-е, также если есть шрифт (font) - там вместо
цифр 1, 2, 3, 4 соответственно якутские буквы -, то есть прослеживается чистая
зависимость редакторов от якутских шрифтов, которые, по-моему, не очень
распространены среди наших пользователей (в принципе, идея Accent-а основана на
таких уже составленных иностранных шрифтах, но в отличие от Word-а здесь нет
необходимости все время обновлять словарь, все уже готово), но именно Accent
предоставит возможность составления шрифтов по желанию и в любом месте.
Например, предположим, что пользователь находится в Москве или даже, для
усложнения, в Китае и ему необходимо составить письмо на якутском языке, там не
будет никаких русских, тем более якутских шрифтов и тут ему на помощь может
прийти только Accent, в котором пять десятков языков (в будущем, дополненном
Accent-е около 130) и которыми можно располагать сколь угодно, то есть на основе
русского, турецкого, греческого, кипрского алфавитов составить якутский и также
составить раскладку клавиатуры. Соответственно, можно печатать на аджарском,
чеченском, бурятском, башкирском и других языках, алфавит которых основан на
каких-либо других алфавитах.
Почему я выбрал именно эту тему? Я думаю, что этот процессор будет, возможно,
довольно сильно распространен не только среди переводчиков-профессионалов, но и
среди простых пользователей. Ведь мир становится все плотнее и интегрированнее,
следовательно простому человеку приходится изучать все больше языков (не говоря
уже об английском), следовательно ему нужен один единый текстовый редактор,
который мог бы “говорить” на многих языках и предоставить весь список услуг
(перенос слов, проверку орфографии, синонимы и т.д.) для каждого отдельного
языка, и как раз данным редактором, на данный момент, является Accent. И я
надеюсь, что мой реферат хоть как-то приблизит Accent к нашим, якутским,
пользователям.