20.8. Системы автоматизации документооборота Автоматизация документооборота заключается в комплексной автоматизации задач разработки, согласования, распространения, поиска и архивного хранения документов организации. Постоянное увеличение количества информации, необходимой для принятия правильного управленческого решения, приводит к тому, что традиционные методы работы с документами становятся неэффективными. Так, по сведениям компании Delphi, 15% бумажных документов безвозвратно теряются и для их поиска сотрудники тратят до 30% своего рабочего времени. При переходе к электронным документам и автоматизации документооборота рост производительности сотрудников увеличивается на 25—50%, сокращается время обработки одного документа более чем на 75%, на 80% уменьшаются расходы на оплату площади для хранения документов (оценка Nortan Nolan Institute). Тенденцию перехода от традиционных технологий организации документооборота к компьютерным отражают следующие цифры: соотношение количества бумажных и электронных документов через пять лет составит 50 на 50%, через десять лет - 30 на 70%;. количество электронных документов удваивается за год, а бумажных документов растет только на 7% (данные компании XPLOR). В конце 80-х — начале 90-х гг. появились и начали интенсивно развиваться ряд новых технологий, успешно используемых в современных системах автоматизации документооборота: технологии обработки изображений документов (Imaging System); системы оптического распознавания символов (Optical Character Recognition System, OCR); системы управления документами, СУД (Document Management System, DMS); полнотекстовые базы данных (Full-Text System); системы автоматизации деловых процедур, АДП (Work-Flow System); Программное обеспечение для рабочих групп (Groupware).^ Системы обработки изображений документов предназначены для ввода, обработки, хранения и поиска графических образов бумажных документов. Подобные системы целесообразно применять в организациях с большим объемом документооборота. Техническое обеспечение систем включает высокоскоростные сканеры, документные контроллеры (выполняют быструю и высокоэффективную компрессию/декомпрессию документов и обеспечивают скоростную работу со сканерами и принтерами), библиотеки-автоматы на базе оптических накопителей с автоматической подачей дисков. Компьютерные образы документов находятся на сервере изображений и просматриваются на рабочих станциях-клиентах. Системы обработки; изображений осуществляют сканирование документов для записи на сервер их классификацию по различным критериям, передачу изображений на рабочую станцию для просмотра, модификацию или печать. Подобные системы предусматривают также определение маршрута передачи изображений по сети, их рассылку по факсу или электронной почте, поиск изображений по отдельным элементам. Так как файлы изображений достигают больших размеров, существуют различные варианты организации их хранения. В целях экономии памяти на запоминающем устройстве большинство систем- сжимают изображения и создают специальный индекс изображений, где содержатся соответствующие значения атрибутов документов, например наименование, автор, тема. В высокопроизводительных системах реализованы технологии, позволяющие увеличить скорость работы. Например, предварительная выборка и перенос изображений с медленных оптических носителей на более быстрые магнитные; адаптируемое кэширование, позволяющее хранить часто используемые изображения в памяти сервера; вывод на лазерный диск; групповое сканирование, обеспечивающее считывание нескольких страниц за одну операцию. Многие системы обработки изображений включают программное обеспечение оптического распознавания символов (ОСК). Применение OCR позволяет решить проблему перевода бумажных документов в электронную форму в виде текстового файла. Системы OCR позволяют Получать электронную копию документа с печатного листа либо копию документа, пришедшего по факсу. Существуют экспериментальные системы, позволяющие подобным образом обрабатывать также и рукописные материалы (Intelligent Character Recognition) Кратко, функционирование системы OCR можно представить следующим образом. С помощью сканирующего устройства считывается изображение документа. В результате распознавания текста изображение документа отображается в файл, отформатированный как текстовый. Таким образом, бумажный документ, минуя низкопроизводительный и трудоемкий ручной ввод, автоматически преобразуется в электронную форму. Выделяют два класса систем OCR — обучаемые и интеллектуальные. Принцип действия систем первого класса основан на поточечном сравнении оцифрованного символа с образцом из справочника. При совпадении образца и символа последний считается распознанным и добавляется в результирующий файл. При таком способе распознавания размеры образца и шрифта документа должны совпадать, т.е. в системе необходимо иметь маски для каждого размера каждого типа шрифта, поэтому подобная система более эффективна в случае однотипного и качественного текста. Во втором случае «маска» сим вола заменяется на его «образ», который может быть использован для любых размеров шрифтов. Для повышения точности распознавания интеллектуальные системы могут выполнять ряд проверок результирующего текста, например осуществлять частотный анализ текста и сравнивать частоту появления данного символа в тексте с его частотой в языке оригинала, или обнаруживать неправильное сочетание символов исходя из правил орфографии. В реальных системах OCR сочетаются различные распознавательные механизмы, что дает возможность обрабатывать любые шрифты и любые тексты. На сегодняшний день известно несколько достаточно качественных программных продуктов по распознаванию текста, в том числе — две системы отечественных фирм, ориентированных прежде всего на распознавание русскоязычных текстов (FineReader и CuneiForm). Средняя скорость работы системы OCR на оборудовании средней мощности составляет примерно одну машинописную страницу в минуту. Качество распознавания — в среднем одна — две ошибки на 1000 знаков в тексте среднего качества. Можно рекомендовать следующие критерии выбора системы OCR: совместимость с существующим или приобретаемым программным и аппаратным обеспечением; скорость сканирования и распознавания преобладающего в данной организации типа текста, например: факс — русский язык, ксерокопия различного качества, машинопись различного качества и др.; качество распознавания текстов различных типов, например количество ошибок на 1000 знаков; способность распознавать редкие шрифты; способность обучения новым символам; наличие элементов семантического анализа текста; наличие модуля проверки орфографии; удобство пользовательского интерфейса.^ Системы управления документами (СУД) предназначены для автоматизации хранения, поиска и управления электронными документами разнообразных форматов, в том числе и изображениями документов. Можно сказать, что СУД фактически выполняют роль СУБД для неструктурированной информации. Развитые системы управления документами осуществляют следующие функции: индексирование документов; полнотекстовый поиск по ключевым словам; управление конфигурацией документа с установлением взаимосвязи между отдельными структурными компонентами; ассемблирование документов, позволяющее объединить все части составного документа для отображения на экране; организация доступа к документу независимо от места его хранения; поиск и управление документами с помощью ключевых компонентов, таких, как оглавление или название раздела; многоуровневая защита данных, которая разрешает доступ к документам только отдельным пользователям или устанавливает виды доступа, например «только для чтения»; администрирование учета и архивирования; организация выдачи/возврата документа; контроль версий документа; рассылка документов. Выполнение функции выдачи/возврата аналогична блокировке записи в БД. Если документ уже выдан, другие пользователи редактировать его не могут. Он остается доступным только для просмотра и копирования. Функция контроля версий используется для отслеживания различных версий документа, позволяет использовать предыдущие редакции документа, которые для экономии памяти часто автоматически архивируются. Функция рассылки документов осуществляется путем интегрирования системы с приложениями электронной почты. Это позволяет перемещать документы по сети масштаба предприятия и передавать документы от одного сотрудника к другому. Развитие сети Internet определяет появление ряда новых функций современных СУД. Например, возможность помещения документов на Web-узле; поддержка обмена документами по интрасети между сотрудниками фирмы, а по Internet — с клиентами и партнерами фирмы. Системы управления документами базируются на архитектуре клиент-сервер, состоящей из четырех основных элементов: центрального приложения, находящегося на сервере; программ клиентов, работающих на сетевых рабочих станциях и образующих пользовательский интерфейс; программного обеспечения для индексирования и поиска, размещенного на сервере СУБД и работающего с базой данных, в которой регистрируется место хранения документа; документов, которые рассматриваются системой как объекты, состоящие из файлов различных типов — текстов, изображений, и могут храниться как на жестких дисках рабочих станций, так и на серверах. Лидером на мировом рынке СУБД является компания ^ Documentum (продукт Enterprise Document Management). Программное обеспечение для рабочих групп (groupware) предназначено для организаций, сотрудникам которых по характеру их деятельности требуется постоянный обмен документами. Осуществляет задачи хранения, просмотра и совместного использования документов. Системы класса groupware позволяют автоматизировать такую деятельность, которая не вписывается в стандартные схемы реляционных баз данных. Например, взаимодействие большого числа людей, исполняющих различные работы в физически удаленных друг от друга местах. Такие приложения могут обрабатывать как структурированную, так и неструктурированную информацию. Основными функциями ПО для рабочих групп являются: электронная почта; поддержка видеоконференций/совещаний; управление изображениями документов; совместное использование документов; маршрутизация документов; календарное планирование. Лучшими системами класса groupware считаются: Lotus Notes компании Lotus Development, Link Works компании Digital Equipment, Group Wise компании Novel. Продукт ^ Lotus Notes - это среда с архитектурой клиент-сервер, предназначенная для разработки и совместного использования приложений коллективной работы. В Lotus Notes входят три основные составляющие: средства маршрутизации и обработки документов; средства обеспечения защиты/управления документами; распределенная база данных (документов). В базах данных Lotus Notes хранятся документы различных форматов, в том числе структурированная информация, различные тексты, электронные таблицы, изображения, видео- и аудиоинформация. Lotus Notes позволяет создавать OLE-серверные приложения, т.е. графики, электронные таблицы, рисунки можно встраивать в документы. Специальные приложения Lotus Notes могут быть связаны с записями и полями реляционных баз данных. Также имеется возможность полнотекстового поиска. Lotus Notes имеет развитую систему управления доступом, который осуществляется на нескольких уровнях: базы данных, документа или частей документа. Управлять доступом можно также на уровне одного пользователя или групп пользователей. В системе выделяется восемь видов доступа: от открытости для всех пользователей до полного запрета доступа. Важнейшим достоинством Lotus Notes является возможность синхронизации баз данных. Базы данных разных компьютеров синхронизируются через определенные интервалы времени путем минимально необходимого для этого обмена по каналам связи. Тиражирование. (процесс двусторонней синхронизации копий распределенной базы данных) дает возможность пользователям различных сетей работать с одной и той же информацией. Через заданные интервалы времени серверы Lotus Notes связываются друг с другом и синхронизируют все изменения в документах и списках управления доступом. Lotus Notes интегрирован с системой электронной почты Notes Mail, позволяющей посылать корреспонденцию другим пользователям или группам. Базовыми средствами для разработки приложений в Lotus Notes являются формы, представления и макрокоманды. Представления — это форма вывода данных на экран или принтер (аналогичны отчетам в реляционных СУБД). Достоинством Lotus Notes является высокая платформенная независимость. Система работает на платформах OS/2, Windows NT, UNIX различных версий, Macintosh System 7. Приложения Lotus Notes достаточно легко масштабируются, их можно адаптировать как к малой рабочей группе, так для организации работы в масштабе предприятия. В последнюю версию Lotus Notes 4.0 включены средства совместимости с Internet (встроен броузер, редактор Web-страниц, почтовая программа, работающая со стандартным Internet-протоколом); расширены инструменты разработки приложений (включен язык LotusScript, являющийся расширенным аналогом Visual Basic). Система GroupWise компании Novel включает средства электронной почты, личного и группового календарного планирования, управления заданиями и документами. Последние версии системы базируются на архитектуре клиент-сервер и поддерживают стандарты Internet, отличаются высокой производительностью и масштабируемостью. Основными составляющими системы являются хранилище документов (библиотека) и три объектно-ориентированные базы данных в формате Novel. Библиотека содержит документы (тексты, электронные таблицы, графические файлы). Все операции с документами регистрируются. Доступ к документам осуществляется под контролем средств защиты. Первая БД хранит так называемые сообщения (почтовые, речевые сообщения, факсы, расписания встреч, перечень заданий, заметки). Вторая БД содержит информацию о связях между пользователями и сообщениями/документами. Третья БД хранит характеристики документов. В Group Wise имеется возможность поиска данных как по полному тексту, так и с помощью фильтров. Для обеспечения безопасности применяются пароли и средства управления правами доступа. Достоинством последней версии Group Wise являются развитые средства управления документами. В систему интегрирована СУБД Soft Solutions, которая ранее выпускалась той же компанией, но отдельным продуктом. Продукт ^ Link Works также относится к классу group ware и является объектно-ориентированной офисной системой. Предоставляет конечным пользователям возможность управления как их персональными, так и связанными с рабочей группой документами при помощи единой объектно-ориентированной среды для настольных систем. Администратор размещает групповые и персональные папкидокументов на серверах Link Works, а конечные пользователи настраивают среду настольных систем на обмен документами между персональными и групповыми папками. В состав Link Works входят: система персонального документооборота (графический аналог рабочего стола); электронная почта; организация совместного использования документов и контроля версий.^ Системы автоматизации деловых процедур (АДП) предназначены для создания сложных прикладных систем коллективной обработки документов в процессе осуществления конкретных бизнес-процессов. Документальные потоки на предприятии привязываются к Существующим бизнес-процессам и регламенту их взаимодействия. При жесткой маршрутизации документа заранее прописывается движение документа по всем рабочим местам. Определяются права пользователей на документ в каждой точке маршрута. При свободной маршрутизации исполнитель может определить дальнейший путь движения документа, обычно на один уровень. Примером систем АДП может служить продукт фирмы Staffware. Документы в системе обрабатываются по принятому организации алгоритму и перемещаются в рамках корпоративнойсистемы между отдельными подразделениями и исполнителями заранее определенным маршрутам. Система основана на технологии клиент-сервер, интегрируется с программными продуктами, работающими на платформах Windows NT, Windows 95, UNIX. В состав системы может входить графический построитель процедур (Graphical Workflow Definer), описывающий документопоток в виде диаграмм с указанием логических шагов, маршрутизации, предельных сроков и форм отчетов. Является инструментом для разработки модели бизнес-процессов. В последнее время наблюдается тенденция сближения и пересечения функциональных возможностей вышеописанных систем. Так, в системах, классифицируемых как groupware, могут использоваться технологии полнотекстовых баз данных, систем управления документами и автоматизации деловых процедур. Поэтому в современных системах автоматизации документооборота вышеуказанные технологии могут применяться как в качестве отдельных, так и интегрированных компонент.Литература к главе 20 1. Дескрипторный словарь по информатике. — М., ВИНИТИ-,1991. - 162с. 2. Ланкастер Ф. Информационно-поисковые системы. — М., Мир, 1972. - 310 с. 3. Михайлов А., Черный А. Основы информатики. — М., Наука, 1968. - 456 с. 4. Монастырский И. Информационно-поисковые системы. - М., Экономика, 1983. - 206 с. 5. Озкарахан Э. Машины баз данных. — М., Мир, 1989. — с. 539-643. 6. Субботин М. Гипертекст. Новая форма письменной коммуникации. - М., Знание, 1994. 7. Сэлтон Г. Автоматическая обработка, хранение и поиск информации. — М., Советское радио, 1973. — 560 с. 8. Тихомиров В.П. Основы гипертекстовой информационной технологии. - М., МЭСИ, 1993.