КУРСОВА РОБОТА
з дисципліни: Аналітико-синтетична переробка інформації
Тема:
Дослідження можливостей програми FineReader.
Зміст
Вступ.............................................................................................................................3
2.Засоби створення електронного документообігу...................................................4
Автоматизація вводу інформації в комп’ютер...............................................5
Автоматичне розпізнання тексту......................................................................5
Програми розпізнання тексту............................................................................6
Розпізнання документів в програмі FineReader.................................................6
Вікно програми ....................................................................................................7
Порядок розпізнання текстових документів. .................................................8
Сканування документів.......................................................................................9
Сегментація документів.......................................................................................9
Розпізнання документа.......................................................................................10
Особливості настройки програми FineReader................................................11
4. Автоматичний переклад документів.......................................................................11
5. Засоби автоматичного переводу...............................................................................12
6. Переклад Web-сторінок.............................................................................................13
Зберігання перекладених документів....................................................................13
Висновок......................................................................................................................14
Література....................................................................................................................15
Вступ
З моменту появлення на світ ПК в світі існувало багато видів таких машин. Але тепер велика кількість персональних і домашніх комп’ютерів відносяться до типу “ІВМ РС”.
Головна заслуга ІВМ – у виготовлені і встановлені єдиного стандарту на основні частини комп'ютера. До того кожний виробник ПК створював власне унікальне “желізо” – тому, що в результаті він ставав монополістом на збір і обслуговування своїх приладів. Але в результаті ринок був переповнений спільними один з одним спільними апаратами, для кожного із котрих треба було створити власні програми. В період встановлення ринку персональних комп’ютерів, прилади кожного ПК було тайною фірми – виробника, і про ніяке копіювання однією фірмою виробника другою в масових масштабах просто не могло.
Ввести із сканера текст в комп’ютер – задача не дуже важка. Але працювати з таким текстом не можливо, як і любе сканування зображення, сторінка з текстом являється графічним файлом. Звідси і виникають проблеми:по-перше, в графічному форматі сторінка займає дуже багато місця. І друга, сама головна проблема відсканований текст можна буде тільки читати, але редагувати і вставляти його франгменти в створений документ. Але сам сканер розпізнавати букви, як букви не вміє, вони для нього всього лиш точки чорного кольору. На світі є програми, які переводять відсканований текст із графічного в текстовий формат – програми розпізнання тексту або OCR. Сучасна OCRповинна вміти дуже багато, розпізнавати тексти набрані не тільки визначеними шрифтами, але й самими різними шрифтами, а також рукописні. Уміти працювати з текстами, які містять слова на декількох мовах, і правильно розпізнавати таблиці. І саме головне розпізнавати не тільки чітко набрані тексти, але й незрозумілі, нечітко набрані тексти. Наприклад, текст з пожовтілої газетної вирізки або машинописної копії. Само собою розпізнати текст це лише півділа. Не менш важливо забезпечити можливість зберігання результату у файлі популярного текстового або табличного формату.
Засоби створення електронного документообігу
Сучасне суспільство не може існувати без документообігу. Документи супроводжують нас на кожному кроці. Навіть мала покупка товару в магазині супроводжується видачею документа – касового чека.
Кожного дня в світі створюються мільярди копій великих і малих документів. На виготовлення документів розходується дуже велика кількість паперу й лісу, а на реєстрацію, перевірку і зберігання документів тратиться дуже багато часу.
Одна із основних задач інформатики полягає в розробці і застосуванні методів використовуючи обчислювальну техніку для переводу документообігу із паперової форми у електрону. Сучасні мережні технології дозволяють вирішити цю задачу, але тільки частково. Всі банки світу уже зв’язані електронними мережами і фінансові документи циркулюють в основному в електронному вигляді. Постійно виходять із вжитку паперові акції підприємств і другі ціні папери. Їх заміняють електроні дипозитарії – бази даних, в яких відомості про акціонерів зберігаються у вигляді записів.
Порівняно недавно появились електроні гроші. Це теж записи в базах даних. Рух електронних грошей відбувається по без паперовій технології шляхом переносу даних із одних записів в інші. Для персонального використання електронних грошей служать пластикові картки, на якій є відомості про власника електронного рахунку на магнітній полосі, або смарт-карті, в яких є дані записи на великій плоскій мікросхемі вбудованій в карті.
По без паперовій технології сьогодні працюють більшість засобів масової інформації. Всі етапи підготовки газети, журнала, книги або рекламної листівки проводять на комп’ютері. Операційна система типу Windows9х, дозволяє одночасно готувати і редагувати тексти, створювати і обробляти ілюстрації, а комп’ютерні мережі об’єднують всіх учасників, які працюють над одним проектом в автономні робочі групи. Робоча група може обходитись без паперових документів до повного завершення роботи над проектом. Тільки коли робота закінчується створюється заключний паперовий документ. Це може бути, як макет газети так і повний комплект креслень необхідних для виготовлення даного документа.
В тих випадках коли початкові дані зразу мають електронний вигляд, перевід документообігу на без паперову технологію відбувається порівняно просто. Представимо, що письменник написав книгу в текстовому редакторі Word, а художник намалював до неї ілюстрації у векторному редакторі AdobeIIIustrator.Представимо, що фотограф підготував необхідні фотографії з допомогою цифрової фотокамери і зробив їх в редакторі AdobePhotoshop. В такому випадку залишається тільки зібрати початкові електроні документи в один заключний документ з допомогою видавничої системи. Всі етапи редагування і коректори також виконують в електронному вигляді з допомогою спеціальних програмних засобів. Робота передається з одного робочого місця на друге по комп’ютерній мережі, і всі учасники роботи допомагають один, одному і виправляють помилки колег без створення паперових документів.
Можливо в далекому майбутньому, коли всі документи будуть зразу готуватись тільки в електронному виді, людство зможе перейти повністю до безпаперовій технології і залишки лісів будуть врятовані, від повного знищення, а целюлозно –паперові комбінати перестануть викидати забруднені води в річки і озера. Сьогодні ПК є не на кожному робочому місці і не всі учасники документообігу об’єднанні комп’ютерними мережами в робочі групи. Тому основним завданням на шляху створення без паперової технології є проблема вводу вихідних даних в електронному виді. В інформатиці ця проблема вирішується створенням і впровадженням спеціально апаратних засобів для переводу графічної і текстової інформації в електрону форму.
Автоматизація вводу інформації в комп’ютер
Основним методом переводу паперових документів в електрону форму являється сканування. Сканування — це технологічний процес, в результаті якого створюється графічний образ паперового документа. Існує декілька видів сканерів, але в їх основу покладено один і той же принцип. Документи освітлюються світлом від спеціального джерела, а відображене світло сприймається світло відображаючим елементом. Мінімальний елемент зображення передається сканером, як кольорова точка. Таким чином в результаті сканування документа створюється графічний файл в, якому зберігається растрове зображення первинного документа. Растрове зображення складається, як відомо з точок. Кількість точок визначається, як розміром зображення так і розширенням сканера.
Автоматичне розпізнання тексту
Після обробки документа сканером виходить графічне зображення документа. Але графічний вигляд не являється текстом документа. Людині досить подивитись на листок паперу з текстом, щоб зрозуміти, що на ньому написано. З точки зору комп’ютера, документ після сканування перетворюється в набір різнокольорових точок, а не в текстовий документ. Проблема розпізнання тексту в складі точкового графічного зображення являється дуже складною. Подібні задачі вирішуються за допомогою спеціальних програмних засобів, називаються вони засоби розпізнання зображень. Реальний технічний прорив в цій області пройшов лише в останні роки. До того розпізнання тексту було можливо лише шляхом порівняння знайдених конфігурацій точок із стандартним зразком. Автори програми критерій “схожості” використовуваний при ідентифікації символів. Такі системи називаються ОСR(OptikalCharactedRecognition-оптичне розпізнання символів) і оперались на спеціально вироблені шрифти. З часом наукові дослідження в області розпізнання зображень буквально перевернули представлення при оптичному розпізнані символів. Сучасні програми можуть ставитись з різноманітними шрифтами без перенастройки. Багато розпізнають навіть малюнковий. --PAGE_BREAK--
Програми розпізнання текстів
Оскільки потреба в розпізнані тексту відсканованих документів достатньо велика, невипадково, що є велика кількість програм, призначена для такої цілі. Так, як різні наукові методи розпізнання тексту розвивалась незалежно один від одного, багато із цих програм використовують різні алгоритми. Ці алгоритми можуть давати різні результати на різні документи. Наприклад, система OCRздібна розпізнати тільки стандартний спеціально підготовлений шрифт і дають на цьому шрифті найкращі результати, які не можуть перевершити ні одна із універсальних програм. Сучасні алгоритми розпізнання тексту не орієнтуються на конкретний шрифт, ні на конкретний алфавіт. Більшість програм розпізнають текст на декількох мовах. Один і той же алгоритм можна використовувати для розпізнання російського, латинського, арабського і других алфавітів і навіть змішаних текстів. Розуміється програма повинна знати про який алфавіт іде мова. Нас перш за все інтересують програми здатні розпізнавати текст, написаний на російській мові. Такі програми випускаються вітчизняними виробниками. Найбільш широко відомі і розповсюджені програми FineReaderі CuneiForm. Програма FineReaderзабезпечує високу якість розпізнання і вигоду застосування.
Розпізнання документів в програмі FineReader
Програма Fine Reader виготовляється вітчизняною компанією АВВУУ Software(w.w.w. bitsoft.ru.). Ця програма призначена для розпізнання текстів на російському, англійському, німецькому, українському, французькому і багатьох інших мовах, а також для розпізнання змішаних двох мовних текстів. Програма має ряд можливостей. Вона дозволяє об’єднати сканування і розпізнання в одну операцію, працювати з пакетами документів і бланками. Програму можна навчити для кращої якості розпізнання неправильно надрукованих текстів і складних шрифтів. Вона дозволяє редагувати текст і провіряти його орфографію. FineReaderпрацює з різними моделями сканерів. Програма дотримується стандарту TWAIN. Ми розглянемо програму на прикладі версії 4.0 одну із основних версій. Вікно програми
Після включення програми FineReaderв меню програми головного меню появляються пункти, забезпечуючи роботу з нею. Вікно програми має типовий для Windows9х вид і має стрічку меню, ряд панелей інструментів і робочу область.
В лівій частині робочої області розміщується панель Пакет, містить список графічних документів які повинні бути перетворені в текст. Ці графічні файли розглядаються, як частинки одного документа. Результати її обробки в подальшому об’єднуються в єдиний текстовий файл. Форма значка, відмічає початковий файл і вказує чи було проведено розпізнання.
Панель в нижній частині робочої області має фрагмент графічного документа в збільшиному виді. З його допомогою можна оцінити якість розпізнання. Цю панель також використовують для “навчання” програми в ході розпізнання тексту.
А всю іншу частину робочої області займають вікна документів. Тут розміщується вікно графічного документа, а також вікно текстового документа після розпізнання.
У верхній частині вікна під стрічкою меню розміщується панель інструментів.
Панель інструментів Стандартна містить кнопки для відкриття документа і для операції з буфером обміну. Інші кнопки цієї панелі служать для зміни представлення документа.
Панель ScanReadмістить кнопки, які відповідають всім етапам перетворення паперового документа в електронний текст. Перша кнопка дозволяє виконати таке перетворення в рамках єдиної операції. Остальні кнопки відповідають відокремленим етапам роботи і містять відкриваючи меню службові для управління відповідною операцією.
Панель Розпізнання дозволяє вказати мову документа і вид шрифта. Остані вимагаються роботи тільки в тих випадках, коли документ має не достатню кількість друку.
Панель Інструменти використовується при роботі з вихідними зображеннями. Вона дозволяє управляти сегментацією документів. З допомогою елементів управління цієї панелі задають послідовність фрагментів текстів в заключному документі.
Елементи управління панелі Формативна використовується для зміни представленні готового тексту або при його редагуванні. Порядок розпізнання текстових документів
Перетворення паперового документа в електронний проходить в три етапи. Кожний із цих етапів програми FineReaderможе виконувати, як автоматичний так і під контролем користувача. Якщо всі етапи проходять автоматично, то перетворення документа проходить за один прийом.
Перший етап роботи – сканування. На цьому етапі завжди використовується сканер. Однак зображення з листка паперу може бути перетворена в цифрову форму і з допомогою других засобів таких, як наприклад цифрові фотоапарати і цифрові відеокамери.
Другий етап роботи – сегментація тексту. Діло в тому, що в паперових документах, на сторінках книжки чи журналу, текст не завжди розміщується в зазначеному порядку. Він може розміщуватись в декількох колонках. Містить малюнки (підписи до них). Доповнюючі вирізки і дані представлені в таблиці, а також можуть заплутати порядок тексту. Тому перш за все, як включити текст документа його розбивають на блоки, вміст фрагментів. Блоки розпізнають послідовно. Отриманий текст включається в документів порядку номера блока.
Останній етап роботи програми-розпізнання. Цей етап не потребує втручання користувача, за винятком тих випадків, коли розпізнання супроводжується ”навчанням”.
Розпізнання тексту відображається у окремому вікні у виді форматованого тексту. Він “втрачає зв’язок” з вихідним зображенням і може редагуватися і форматуватися незалежно від нього. програма виділяє кольором ті символи, які вона сама розглядає, як неоднозначно розпізнання. Це спрощує пошук помилок засобами програми в отримані тексту, можна також провести перевірку граматики.
Отриманий текст можна зберегти у виді форматованого документа. Передбачено також можливість прямої передачі отриманого тексту в програму WordчиExcel, а також в буфер обмінуWindows.
Сканування документа
Сканування – це технічна операція, яку виконує пристрій для сканування. Задача програми FineReaderна цьому етапі складається з того, щоб приняти получену інформацію і прийняти значки від сканування сторінок на панелі Пакет. Так сторінки готуються до розпізнання.
Для того щоб провести сканування за допомогою програми FineReader, необхідно запустити цю програму і включити сканер. Проскановані сторінки проходять по клацані на кнопки Сканувати на панель інструментів або при написанні комбінації клавіш Ctrl+K.
Програма здатна працювати із сканером, як безпосередньо так і через протокол. При безпосередній взаємодії із сканером можливість сканування кольорових зображень не використовується так, як текст являється в любому випадку одноколірним.
Програма використовується для сканування, яке задано по зменшенню. Для того щоб вибрати таке обладнання чи змінити його настройку, потрібно клацнути на відкриваючій кнопці поруч з кнопкою Сканувати і вибрати у відкритому меню пункт Опції – відкривається діалогове вікно Опції.
Якщо до комп’ютера підключено декілька сканерів або сканер був підключений після установки програми, слід клацнути на кнопці Вибрати сканер. В тому випадку програма проведе пошук підключених до комп’ютера сканерів і дозволити вибрати потрібний.
Для зміни настройки сканера використовують кнопку Настройки сканера.
Коли сканер вибраний появляється два флажка, в нижній частині діалогового вікна. Якщо поставити флажок Показувати діалог TWAIN-драйвера сканера, то сканування проходить через протокол з відображенням діалогового вікна. В протележному випадку програма працює напряму із сканером. Використати протокол має значення тільки в тому випадку, коли робота напряму неможлива або дає неякісні результати.
Флажок Показати опції перед початком сканування застосовують лише в тому випадку, коли паперові сторінки документа сильно відрізняється одна від другої. Це може бути викликано, наприклад, розмірами паперу або тим, що різні сторінки друкувались в різний час і різними засобами. В такому випадку перед скануванням кожної сторінки відкривається діалогове вікно настройки сканера, щоби користувач міг відрегулювати якість процесу.
Сам процес сканування проходить в автоматичному режимі. Якщо потрібно проробити багато сторінок, то краще всього спочатку їх усіх просканувати, а уже потім проводити розпізнання. Це зв’язано з тим, що сканування потребує присутності користувача через управління сканером, а розпізнання може проводитися в автоматичному режимі. продолжение
--PAGE_BREAK--
Сегментація документа
Під порядком розпізнання тексту розуміється послідовне розпізнання сторінок зліва на право. Якщо текст розбитий на декілька колонок або має вирізки, підмалюнкові підписи, примітки і другі елементи форматування, його розпізнання в послідовному порядку неможливо. В таких випадках програма розбиває текст на блоки, кожний з яких представляє собою фрагмент тексту, розпізнаний в послідовному порядку. Таке розбиття документа називається сегментацією.
Автоматична сегментація – це проста задача для програми. Програма шукає проміжки між стрічками, а також зони початку і кінця стрічок. Якщо послідовність стрічок, ідуть підряд, має одинакові зони початку і кінця, то програма розглядає таку область як текстовий блок. Якщо проміжки між стрічками взагалі існують, то по всій можливості, мова іде про ілюстрацію. Якщо знайдеться велике число вертикальних і горизонтальних фрагментів, які відображають правильну структуру, то напевне в текст включена таблиця. Якщо клацнути на кнопці Сегментація виділені сторінки, то сегментація сторінки проходить автоматично. правда зображення документа має невисоку якість, то сегментація може бути виконано не правильно, що виявляється у великій кількості малих блоків. В таких випадках можна вручну вказати границі блоків або змінити автоматичне розбиття. Нові прямокутні блоки створюються методом перетягуванням миші. При перетягуванні створюється блок і виділяється пунктирною рамкою, яка в момент створення блока перетворюється в єдину зелену лінію. Якщо сторінка має простий стандартний вид, то простіше вручну створити одиничний блок, який охоплює всю сторінку, чим представити це програмі, ризикуючи можливістю появлення помилок. Один із створених блоків являється текучим. Він обведений великою жирною лінією, а його вершини помічені маркерами. Переніс цих маркерів можна редагувати границі блока. Для створення блока прямокутної форми або зміна послідовності блоків використовують кнопки панелі інструментів Інструменти. Всі кнопки цієї панелі використовують на етапі сегментації. Програма FineReaderрозпізнає декілька блоків які працюють по різному. Такі блоки виділяються різними кольорами. Текстові блоки обводяться зеленою лінією. Щоб змінити тип блока потрібно клацнути в зоні блока ПКМ і вибрати потрібний тип в меню. Тип блока контекстного меню.
Розпізнання документа
Після сегментації і встановлення порядку текстових блоків виконує останній етап роботи – розпізнання. Якщо документ надрукований не стандартним шрифтом, який добре відсканований, по клацанню кнопки Розпознать відкриту сторінку досить, щоб документ був розпізнаний. Якщо паперовий документ має нестандартний шрифт, то процес розпізнання ускладнюється. В такому випадку програма може не справитись з розпізнанням символів і допускати однотипні помилки. В таких випадках для великих документів перш за все спочатку треба провести навчання програми з особливостями даного документа. Це досить великий процес, але він все таки простіший, ніж ручний ввід багато сторінкового документа. Настройку розпізнання починають із створення еталону в, якому зберігаються особливості даного документа. Для цього потрібно виконати команду Сервіс – Редактор еталонів, клацнути у відкритому діалоговому вікні Еталони на кнопці Нові еталони і ввести ім’я створення еталона.
Для підключення еталона при розпізнані, треба клацнути на відкриваючі кнопці поруч з кнопкою Розпізнати відкриту сторінку і вибрати пункт Опції. У відкритому діалоговому вікні в групі Обучение слід вибрати тільки, що створений еталон. Якщо розпізнання документа відповідає еталону, який був створений і настроєний раніше, то вибрати не новий, а старий еталон.
Для “навчання” еталона слід встановити прапорець Розпізнання з навчанням.
Режим розпізнання в такому випадку змінюється. Коли програма не може розпізнати символ, то вона видає діалогове вікно “навчання еталона”. У верхній частині цього вікна проводиться збільшення зображень розпізнання стрічки. Текучий символ обведений рамкою.
В полі із списком Символ, який розуміє програма, знаходиться в рамці.
Необхідно переконатись, що символ в полі вказаний правильно і замінити його у випадку необхідності. Після цього треба клацнути на кнопці “навчання”.
Якщо неправильно вказані границі символу, то кнопки Зсунути вліво і Зсунути вправо, дозволять поправити положення рамки.
Якщо правильно розмістити рамку не вдається або в тексті зустрічається незнайомий символ, який правильно перекласти не можливо, слід клацнути на кнопці “Пропустити”.
Особливості настройки програми FineReader
Як і більшість других додатків Windows, програму FineReaderможна настроїти відповідно з потребою конкретного користувача. Всі настройки виконуються за допомогою діалогового вікна Опції, які відкриваються з допомогою любої відкриваючої стрілки на панелі інструментів, чи через меню Сервіс. Якщо використана панель інструментів, то діалогове вікно відкривається на вкладці, відповідно до використаної кнопки панелі інструментів.
Вкладка Сканування служить для вибору і настройки сканера, а також для визначення способу доступу до нього.
Вкладка Сегментація дозволяє настроювати деякі параметри для автоматичної сегментації. тут задаються параметри автоматичного розбиття таблиці і настроюють режим автоматичної сегментації багато стовпчикового тексту.
Засоби вкладки Форматування дозволяє задавати спосіб форматування розпізнаної сторінки і вибрати потрібний шрифт.
Вкладка Розпізнавати визначає параметри розпізнання документа. Вона дозволяє задати мову документа і особливості початкового шрифту, а також настроїти режим розпізнання з навчанням. Тут також задається метод кольорового виділення не надійно розпізнаного символу.
Елементами управління вкладки Перевірка задають метод перевірки орфографії і спосіб виділення знайдених помилок чи незрозумілих місць.
Вкладка Установки розпізнає всі настройки програми. Тут задають мову інтерфейсу і настроюють використані одиниці вимірювання.
Прапорці панелей Показувати розпізнають спосіб представлення вікна програми і відкритих документів.
панель Кольори дозволяє вибрати колір різноманітних елементів документа. В нижній частині вікна можна задати доповнюючи параметри.
Автоматичний переклад документів
Ідея автоматичного переводу тексту з однієї мови на другу появилася зчасу перших комп’ютерів. Як щоб повноціний перевід був можливим, значно б спростилось спілкування між народами і обмін документами, але це дуже складна задача. Всі спираються на об’єм тексту який переводиться. Комп’ютерний словник може справитись з переводом окремих слів особливо, якщо він може запропонувати декілька значень на вибір. Однак ця ситуація замітно ускладнюється, якщо переходим до переводу цілих фраз і тим більше абзаців тексту. Для таких випадків надійного перекладу з однієї мовми на другу не існує. Це звязано з тим, що кожна фраза мови має два рівня :синтаксичну і смислову. Синтаксичний рівень визначає побудову речення, а смисловий його склад. Для правельного смислового перекладу, необхідно брати до уваги не тільки конкретну фразу або абзац, а і цілу частину тексту. Таким чином, розраховувати на, то, що при автоматичному перекладі получеться повний документ. Програми автоматичного переводу розраховують в першу чергу, на тих хто за усім не знає відповідної іноземної мови, але повинен ознайомитися із змістом документа. Крім того подібні програми дозволяють виготовляти короткі повідомлення електроної пошти на іноземній мові. Такі повідомлення важають програмними, але скорше всього кориспондент зуміє зрозуміти, що йому потім повідомити. Якщо нема ніяких зауважень дро якості переводу тексту з іноземної мови на російську. Програми автоматичного переводу розглядаються, як засиби отримання простого чорновика. Якщо подібні потреби є, то використовують подібні програми. Кваліфіковане редагування тексту отриманого автоматичним шляхом, проводиться в декілька раз дорожче, ніж послуги спеціальних перекладачів.
Засоби автоматичного переводу
Програмні засоби автоматичного переводу можна умовно розбити на дві основні категорії. Першу категорію представляють комп’ютерні словники. Призначення комп’ютерних словників ті, що в звичайних словників: представити значення невідомого слова. Перевага комп’ютерних словників складається з швидкості доступу і вигоди автоматичного пошуку виділеного слова. Автоматичний словник дає змогу перекладу слова по написанню виділеної комбінації кнопок. До другої категорії відносяться програми, які дозволяють виконувати автоматичний переклад тексту. Вони сприймають текст на одній мові і видають текст на другій мові. В ході роботи програма використовує обширені словники, набори граматичних правил і другі засоби, які забезпечують найліпше (з точки зору програми), якість перекладу. Словник може складатися не тільки з виділеного слова, але й з словосполучення. Використовуючи ці засоби програма аналізує граматичну структуру тексту, знаходить зв’язок між словами і намагається побудувати правильний переклад фрази на іншій мові. Чим коротша пропозиція тим більше шансів на то, що таке речення буде правильне. В довгих реченнях і складних граматичних інструкціях люба система перекладу може дати збої. В Росії найбільш широке розповсюдження отримали програми автоматичного перекладу з англійської на російську,із російської на англійську мову. Це пояснюється головною роллю англійської мови в сфері міжнародного спілкування. Англійська мова досить проста для вивчення однак її простота несподівано створює допоміжні проблеми для систем автоматичного перекладу. Справа в тім, що одинаково написані слова в англійській мові часто відносяться до різних частин мови. Це ускладнює граматичний аналіз речення і призводить до виникнення грубих помилок в автоматичному перекладі.
Автоматичний перевід
р/>/>остий перевід вихідного файла, який містить текст, з допомогою програми Promt98 виконується дуже легко. Спочатку треба загрузити файл з вихідним текстом. Це виконують командою файл в відкрити або здопомогою відповідної кнопки на панелі інструментів Стандартна. Після вибору імені вихідного файла програма відкриває діалогове вікно конвертувати файл. В цьому діалоговому вікні автоматично вибирається формат файлу і необхідне направлення переводу. Користувачу лишається тільки переконатись в тому, що параметри зазначені вірно і клацнути на кнопці ОК. Вихідний документ загружується в програму і спочатку одночасно відображається, як в області оригіналу так і в області переводу. Для виконання переводу треба дати команду перевід – весь текст або використати кнопку на панелі інструментів перевід. Перевід представляє собою складну і повільну операцію. Під час переводу в основному вікні програми можна дивитись прокручування вихідного документу і заміну прикладів вихідного тексту на другій мові. До кінця документ можна продивитися, як вихідний текст і текст переводу, а також виконати їх редагування. Якщо в оригіналі вносяться зміни, можна повторити перевід змінних абзаців. Для цього використовують команду Перевід текучий абзац або кнопку текучий абзац на панелі інструментів перевід. В такому випадку всі абзаци переводу залишаються незмінними.
Для швидкого переводу неформатованого тексту призначено Qtransйого також можна запустити через головне меню або кнопку на панелі індикації. В цьому випадку не передбачені засоби для загрузки або збереження документа. Вихідний текст вводиться в ручну або копіюється через буфер обміну. Зазначити направлення переводу дозволяє кнопка Направлення переводу. Вибране направлення переводу відображається в стрічці заголовка вікна. Переведений текст відображається в нижній частині вікна після клацання на кнопці Переврсти. Цей текст можна зберегти тільки шляхом копіювання через буфер обміну, що виконують клацанням на кнопці Скопіювати перевід. Інші командні кнопки використовують при виборі словників і завданні резервованих слів.
Переклад Web– сторінок продолжение
--PAGE_BREAK--
Більшість користувачів розглядають Web– сторіноки Інтернета, як документи для яких- потрібний швидкий перевід, між іншим без особливих вимог до якості. Абсолютна більшість Web– сторінок в світі написано на англійській мові, і програма Promt98 має спеціальне положення для швидкого переводу Web– сторінок – програму WebView. Програму WebViewзапускають так як інші прикладні Promt98 через головне меню або з викоритсанням спеціального значка на панелі індикації. WebViewпредставляє собою браузер, який проводить синхронний перевід Web– сторінок під час роботи в Інтернеті. Функціональні можливості WebView, як засоби перегляду
Webвідповідає можливостям Інтернет. На відміну від традиційних браузерів вікно програми розбито на дві області. На верхній області відображається вихідна сторінка взята з Інтернету, а в нижній її перевід. У переводі зберігаються гіперзсилки, зображення, побудовані об’єкти. Обидві області абсолютно рівноправні у використанні гіперзсилок присутності документа. Переклад сторінки виконують автоматично вході загрузки. Режим автоматичного перекладу можна відключити. В тому випадку для перекладду сторінки використовують команду Перевід – перевід сторінки. Важливою особливістю програми являється також автоматичний перевід головних слів, використаних при пошуку потрібної інформації в мережі. Коли дають команди Перевід- пошук або клацнути на кнопку пошук в Web, відкривається діалогове вікно пошук в Інтернет, дозволяє сформувати запит до пошукового серверу. Запит формується за заданими правилами.
Головні слова запиту автоматично переводяться в заданому направленні перекладу. Сформований запит відображається на екрані. Цей запит можна направити в любу із декількох доступних програм пошукових систем.
Збереження перекладених документів
Переклад документів звичайно являє собою проміжну операцію, тому система пропонує багато різних варіантів збереження документа. Вибір варіанта збереження залежить від того, як пропонують використати документ в майбутньому.
Команда Файл – зберегти документ і кнопка збереже на панелі інструментів. Основна, яка зберігає весь документ у внутрішньому форматі програми. Команда файл – зберегти документ зберігає документ у внутрішньому форматі, але дозволяє вибрати ім’я файла.
Якщо потрібно зберегти тільки результати переводу, треба використовувати під меню файл- сохраніть. Цим способом зберігають тільки вихідний текст або перевід. У відкритому діалоговому вікні можна вибрати любий із доступних форматів збереженого тексту.
Якщо в подальшому редагування переводу в одному із розповсюджених текстових процесорів, вигідно використовувати збереження в режимі білінгви, то це є двох мовний текст.
В цьому режимі записують у файл абзаци оригінала і переводи почергово. Таким чином при послідовному редагуванні оригінала і перевід весь час знаходиться перед очима одночасно. Правда при збереженні білінгви форматування тексту може перетворитися в помилку, тому більша частина даних про форматування відкидається і набір відпустимих форматів файлу для збереження скорочений. Другі можливості підменю зберегти включають окремі збереження списків незнайомих слів і списків зарезервованих слів. Список зарезервованих слів можна в подальшому підключити до другого тематично подібного документу.
Висновок
Одна із задач, яка стоїть перед інформатикою, як наукою стоїть в переводі документообігу із паперової в електронну форму. Цю задачу вирішують шляхом розробки і впровадження апаратних і програмних засобів і методів електронного документообігу. Одним із основних прийомів переводу паперових документів в електронну являється сканування. В результаті сканування створюється графічний образ текстового документа. Для сканування викоритстовують спеціальний прилад, який називається сканером, хоч графічний образ документа можна дістати за допомогою других засобів вводу інформації.