Финансовая газета. Региональный выпуск.Август. №34, 2005, стр. 15.КЛАССИФИКАЦИЯ И КОДИРОВАНИЕ КАК СРЕДСТВА ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙВ настоящее время, чтобы успешно конкурировать на рынке товаров и услуг, их производители должны оперативно и адекватно реагировать на быстро меняющиеся запросы потенциальных потребителей, обеспечивая высокое качество конечного продукта при минимальных издержках на его производство. Для реализации указанных задач компаниям-производителям приходится своевременно осуществлять реорганизацию своих бизнес-процессов и внедрять информационные системы (ИС), гарантирующие их поддержку. Вместе с тем необходимо учитывать, что любая модернизация ИС представляет собой результат совместной деятельности специалистов управления (заказчиков, а в последующем пользователей ИС) и специалистов информационной сферы (разработчиков ИС). Следовательно, от того, насколько эффективно организовано это взаимодействие, во многом зависят и сроки, и затраты, и качество создаваемых ИС. Исключить специалистов управления из процесса разработки (модернизации) ИС принципиально невозможно, поскольку реально любая ИС создается в конечном счете «для» и «под» заказчика, т.е. с учетом его задач, требований, стиля работы и т.п., поэтому они помимо профессионального знания в своей предметной области должны обладать и определенными знаниями в информационной сфере, в первую очередь для того, чтобы общаться на одном языке с разработчиками ИС, понимать «что и для чего» от них требуется, иметь хотя бы общее представление о процессе создания ИС и о компонентах, используемых при ее функционировании. Одним из элементов, играющих важную роль при разработке современных ИС, является организация кодирования информации. При этом под кодированием понимается присвоение информации условных обозначений, т.е. придание ей условного, формализованного представления, путем отождествления данных с определенными значениями кодовых комбинаций. В целом наряду с другими способами и методами, применяемыми при организации информационных процессов, кодирование информации, как правило, используется для достижения трех основных целей: повышения эффективности (производительности) информационных процессов путем применения рациональных способов представления информации в системах управления; повышения надежности процессов передачи и хранения информации, т.е. защиты ее от утери и искажения (вызванных как несовершенством технических средств, так и ошибочными, непрофессиональными действиями пользователей), за счет введения избыточных позиций; повышения информационной безопасности (т.е. защиты от злонамеренных попыток несанкционированного съема и искажения) путем криптозащиты информации. Применение принципов кодирования в целях повышения эффективности информационных процессов возможно в результате: унификации представления (а значит, и восприятия) информации различными пользователями (например, «1» вместо «uno», «ein», «un», «one», «один»);более компактного представления информации на носителях и в технических устройствах (например, номер месяца - «09» вместо его названия «сентябрь», номенклатурный номер материала вместо его наименования и т.п.), что важно в условиях ручного ввода данных с бумажных носителей;снижения вероятности ошибочного восприятия информации с бумажных носителей с помощью технологий распознавания образов (например, использование табельного номера работника вместо ФИО и т.п.) способствует значительному сокращению количества вводимых символов, а значит, снижению вероятности ошибок из-за уменьшения количества считываемых позиций; упрощения процедуры программно-аппаратного контроля за корректностью ввода данных;рациональной организации поиска и выбора необходимой информации из баз и хранилищ данных;удобного формирования различного рода разрезов (уровней) итоговых значений данных, что характерно при решении большинства экономических задач, и т.п. Следует также отметить, что кодирование, как правило, ведет к значительному уменьшению объемов используемых данных (при вводе, хранении, передаче и переработке одной и той же информации). При этом особая роль отводится методам классификации экономической информации. Это объясняется тем, что многообразие форм и значений, которые могут приобретать различные экономические показатели, используемые в системах управления народнохозяйственными объектами различных уровней, обусловливает необходимость применения определенных принципов систематизации этой информации в целях обеспечения удобства ее хранения, поиска, обработки и использования в процессе подготовки управленческих решений. Систематизация экономической информации базируется на различных принципах ее классификации (построения систем классификации экономической информации) и кодирования. Под классификацией понимается систематизированное распределение явлений и объектов на определенные группы, классы, разряды исходя из их сходства и различий. Основанием для классификации, как правило, служит какой-либо качественный признак экономической информации. Она может осуществляться по нескольким ступеням детализации. Например, народное хозяйство подразделяется на отрасли: промышленность, сельское хозяйство, строительство, транспорт и т.п., а каждая отрасль в свою очередь подразделяется на более узкие отрасли (подотрасли): легкая промышленность, тяжелая промышленность, пищевая промышленность и т.д. Примером наиболее важных и распространенных систем классификации, или просто классификаторов, является классификация отраслей народного хозяйства, товаров, занятий, основных фондов. Таким образом, классификатор - это систематизированный перечень объектов (отраслей народного хозяйства, предприятий, продукции, занятий и т.д.), каждому из которых присваивается определенный шифр (код). Код заменяет название объекта и служит средством его идентификации. Благодаря применению систем классификации обеспечивается унификация восприятия информации и процессов ее обработки в системах экономического управления, что приводит к сокращению затрат на создание и эксплуатацию информационных систем, повышению их эффективности. Это достигается за счет того, что: значительно сокращается объем требуемой памяти, так как достаточно хранить только характеристики классов, а не каждого конкретного, отдельного объекта; облегчается процедура поиска требуемой информации благодаря ее упорядоченному хранению; упрощается процесс формирования различного рода аналитических итоговых данных. Сущность классификации заключается в том, что вся информация (информационные совокупности), с которой приходится иметь дело в процессе управления различными объектами, группируется по отдельным категориям (классам) в соответствии с теми или иными свойствами (группировочными признаками). Причем основой для классификации экономической информации служит выделение в составе показателей таких отдельных информационных единиц, как реквизиты-признаки, отражающие разные качественные аспекты экономических процессов. Группируя экономическую информацию в соответствии с определенными значениями реквизитов-признаков, можно создать различные системы классификации (или классификаторы) и системы кодирования, что является необходимым условием для эффективной организации ее обработки. Для каждого реквизита-признака одного наименования может быть разработан свой классификатор. С помощью классификаторов экономической информации возможно не только ее упорядочение (последовательное расположение единиц информации одной общей формы), но и создание необходимых предпосылок для однозначного условного изображения (т.е. кодирования) этих единиц, а также их однозначного толкования на любых объектах управления. Все классификаторы строятся только в отношении реквизитов-признаков с известными значениями этих признаков, но их построение в то же время должно обеспечивать возможность как расширения (путем ввода новых), так и сужения (сжатия) номенклатуры классифицируемых единиц (за счет изъятия устаревших позиций), без нарушения логической структуры установленной системы. В зависимости от специфики представления информации, целей и способов взаимодействия с ней в практике организационно-экономического управления используются три способа (системы) классификации объектов: иерархическая, фасетная и дескрипторная (или описательная).Финансовая газета. Региональный выпуск.Сентябрь. №35, 2005, стр. 14-15.^ КЛАССИФИКАЦИЯ И КОДИРОВАНИЕ КАК СРЕДСТВА ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ(Продолжение. Начало см. в № 34) Иерархическая классификацияПри иерархической классификации все множество объектов последовательно разбивается на соподчиненные (вложенные друг в друга) подмножества. Эта классификация соответствует уровням детализации описания (характеристики) информационных единиц. Наиболее ярким примером иерархической классификации может служить УДК (Универсальная десятичная классификация), которая является в широком международном употреблении модификацией Десятичной классификации Дьюи. Иерархический принцип классификации заключается в переходе «от общего к частному» при детализации характеристик идентифицируемого объекта и структурно может быть представлен с помощью графа «типа дерева». В такой системе классификации кодируемые информационные единицы идентифицируются как соответствующие узлы графа, а размерность кодов (т.е. количество разрядов в них) увеличивается по мере перемещения от корня графа к его вершинам. Например, значение элементов структуры кода 621.3 в системе УДК отражает принадлежность классифицируемого объекта в следующем порядке его иерархической детализации (рис. 1).^ Рис. 1. Структура соподчиненности (уточнения) кодируемых позиций в условиях иерархической классификацииСфера применения иерархической классификации весьма обширна. Важными факторами, определяющими распространенность ее применения, являются: простота построения и широкие возможности использования классификационных группировок различных уровней и детализации классифицируемых объектов. К недостаткам, вытекающим из присущей иерархической классификации «жесткости» структуры, следует отнести сложности при внесении изменений и невозможность формирования группировок объектов по заранее не предусмотренным сочетаниям признаков.^ Фасетная классификацияДля кодирования показателей преимущественно оценочного типа, имеющих относительно не сложную структуру записи, может быть применена фасетная классификация. При такой классификации определяются классификационные признаки объекта (фасеты), для каждого из них устанавливается набор конкретных значений, в соответствии с которыми и образуются независимые классификационные группировки объектов. Таким образом, фасет - это группа однородных терминов, связанных общностью какого-либо признака (характеристики, основания деления и т.п.). Значения признаков в фасетах могут располагаться в произвольном порядке, поэтому внесение изменений в фасеты не представляет каких-либо трудностей. Главное требование при заполнении фасета - исключение возможности повторения одних и тех же значений классификационных признаков в различных фасетах. Фасетная система позволяет при группировке объектов выбирать классификационные признаки независимо друг от друга, что придает ей большую гибкость (табл. 1).^ Таблица 1 Фасетная классификация(на примере лакокрасочных изделий) Вид Назначение Состав Отношение к воздействию Оптические свойства … Цвет окружающей среды воды Ф1 Ф2 Ф3 Ф4 Ф5 Ф6 … ФN 1.Эмаль 2.Краска 3.Грунтовка 4.Лак … 1.Техническое 2.Санитарное 3.Декоративное … 1.Масляная 2.Водная 3.Синтети- ческая … 1.Для наружных работ 2.Для внутренних работ 3.Для наружных и внутренних работ … 1.Водостой- кая 2.Неводостой- кая … 1.Прозрачная 2.Непрозрачная 3.Люминисцент- ная … … 1.Белая 2.Голубая 3.Желтая … Смысл кодирования в данном случае будет представлен парами чисел (индексов), отражающих номера классификационной позиции (фасета) и номера слов (значений) в соответствующих списках фасета. Например, «белая непрозрачная водостойкая синтетическая эмаль для наружной декоративной отделки» в условиях представленной выше фасетной классификации будет закодирована, как: Ф1,1 ; Ф2,3 ; Ф3,3 ; Ф4,1 ; Ф5,1 ; Ф6,2 ; ФN,1. Несмотря на то что фасетная классификация объектов обладает большей гибкостью (возможность практически не ограниченного добавления числа фасетов, расширения состава значения в отдельных фасетах, группировки множества по любому сочетанию и числу фасетов), в силу специфики характера обработки экономической информации она имеет довольно ограниченное распространение в организационно-экономическом управлении и применяется главным образом для реализации информационно-поисковых систем. Например, каталог поисковой системы Яndex построен с использованием фасетной классификации. Основными фасетами для спецификации поискового образа в нем являются: тема, регион, жанр, источник информации, адресат информации и т.д. ^ Дескрипторная классификацияПримером другой системы классификации, широко используемой при организации поиска информации, является дескрипторная классификация. Язык дескрипторной системы приближен к естественному профессиональному языку описания информационных объектов, что, несомненно, является его достоинством. При этой классификации выделяется совокупность (совокупности) ключевых слов или словосочетаний, описывающих тот или иной объект предметной области. Среди ключевых слов, являющихся синонимами, выбирается одно, называемое дескриптором (дескриптор - единственный член синонимического ряда ключевых слов). С помощью дескрипторов создается внутренний поисковый образ конкретных информационных запросов. Для автоматизации поиска информации по различным запросам между дескрипторами устанавливаются ассоциативные связи, несущие различную смысловую и синтаксическую нагрузку, например, такие, как:^ ЦЕЛОЕ - ЧАСТЬ: баланс - раздел - группа_(статей), - статья; компания - отдел - (рабочая)_группа - работник; …;РОД - ВИД: металл - черный_(металл), цветной_(металл); черный_(металл) - сталь, чугун; сталь - холоднокатаная_(сталь), горячекатаная_(сталь), …; ДОПОЛНЕНИЕ: отчетность - бухгалтерская, статистическая, налоговая, внутренняя …, ресурсы - материальные, трудовые, финансовые, информационные; ПРОТИВОПОСТАВЛЕНИЕ: актив - пассив, приход - расход, прибыль - убытки, ресурсы - затраты …;^ ОБЪЕКТ - ДЕЙСТВИЕ: материалы - расход, материалы - приход, материалы - остаток, …; ДЕЙСТВИЕ - ВРЕМЯ: расход - за месяц, расход - за квартал, расход - за год, …;^ ДЕЙСТВИЕ - МЕСТО: приход - склад, расход - склад, остаток - склад, расход - цех, … и т.п. На основе выявленных связей между словами, составляющими язык данной предметной области, строятся так называемые семантические карты (semantic maps), отражающие все многообразие ассоциативных взаимосвязей между дескрипторами. С их помощью могут быть реализованы переходы от одного дескриптора к другому, связанному с ним по смыслу в соответствии с требуемым характером ассоциативной связи (смыслом запроса). Таким образом, семантические карты обеспечивают возможность автоматической идентификации различных запросов, сформулированных на естественном профессиональном языке специалистов данной предметной области. Для обеспечения автоматического перехода с входного языка к его дескрипторному эквиваленту используются алфавитные словари системы, фиксирующие соответствие между словами входного языка системы и его дескрипторами (табл. 2). При этом для слов входного языка, имеющих различные приставки, падежные окончания и окончания множественного числа и другие подобные отличия, поиск выполняется на основе анализа их языковых морфем , что исключает влияние таких различий на процедуру поиска дескрипторов в словаре системы. Морфема - неизменяемая часть слова.^ Таблица 2Фрагмент алфавитного словаря дескрипторной системы классификации(дескрипторы выделены курсивом) Термин входного языка Код дескриптора … … движение 06 008 … … наличие 06 032 … … оборот 06 008 остаток 06 032 отпуск 06 034 поступление 06 033 приход 06 033 расход 06 034 … … Когда запрос имеет смысл в рамках конкретной системы (что можно выявить, например, опираясь на механизм теории клампов , путем проверки корректности ассоциативной цепочки - рис. 2), осуществляется дальнейший переход к его обработке в соответствии с функцией этой системы. Теория «клампов», разработанная Р. Нидхэмом (clamps – группа слов, тесно взаимосвязанных между собой по смыслу), может быть использована для смыслового анализа текста с помощью компьютера, а также при формировании искусственных языков, близких к естественному.^ Рис. 2. Фрагмент семантической карты с ассоциативной цепочкой поискового запроса: «объем расхода материальных ресурсов в натуральном измерении»Очевидно, достоинства дескрипторной системы могут быть использованы при решении актуальной проблемы разработки информационных систем непосредственно по запросам специалистами управления без привлечения профессиональных программистов, которая впервые была широко озвучена в 1976 г. на конгрессе IFIP (International Federation of Information Processing) в Стокгольме в виде лозунга: «Программирование без программистов в 80-м году». Причем принципиальная возможность реализации этого лозунга была продемонстрирована на практике в 80-х годах прошлого века, например, в системе автоматизированного проектирования программ с входным языком, близким к естественному, когда по запросу специалиста управления компьютерная система осуществляет выбор абстрактной экономико-математической модели (ЭММ) задачи и последующую ее настройку путем конкретизации значений параметров модели (рис. 3).^ Рис. 3. Схема обработки языковых конструкций языка запроса на генерацию программ [6](жирным шрифтом в запросе выделены морфемы ключевых слов входного языка системы)^ Виды классификаторовОсновную, наиболее представительную часть в системах организационно-экономического управления составляет планово-директивная и учетно-отчетная информация, которая является исходной для формирования различного рода аналитических показателей и для которой наиболее характерными видами преобразования считаются соответственно разукрупнение (детализация) и укрупнение (агрегирование) по мере ее перемещения по уровням иерархии управления, поэтому иерархическая система классификации находит наибольшее применение в процессах управления народнохозяйственными объектами, несмотря на достаточно «жесткую» структуру ее построения. В настоящее время в организационно-экономическом управлении классификаторы в основном строятся по иерархической системе и подразделяются на общегосударственные, отраслевые, региональные и локальные. Общегосударственные классификаторы охватывают все значения реквизитов-признаков и связанных с ними показателей в масштабах всего народного хозяйства. Отраслевые классификаторы ведутся в масштабах отрасли (министерства, ведомства), региональные - в пределах территории (республики, губернии, области, района, города), локальные - в пределах предприятий, учреждений и т.п. Во всех классификаторах не только фиксируется место (позиция) каждого реквизита-признака, но и каждой позиции присваивается уникальное условное обозначение (код). При таком делении классификаторов существенное значение имеет соблюдение условия их совместимости, что обеспечивает возможность автоматического перехода от одного классификатора к другому и расширение или сужение диапазона обозначения признаков классификации объектов. Особое место среди классификаторов занимают функциональные, относящиеся к определенным функциям управления, так как они связаны с методологией организации соответствующих управленческих работ. Примером такого функционального классификатора является План счетов бухгалтерского учета. Систематизация информации с помощью классификаторов не только ведет к однозначному определению ее информационных единиц и их значений, но и дает возможность устанавливать между ними логико-математические отношения, при этом раскрывается механизм реализации информационных взаимосвязей для различных сфер и уровней управления. Для обеспечения поиска, комплексной обработки и увязки информации в информационных системах используются такие общегосударственные классификаторы, как: ОКТЭП (технико-экономических показателей); ОКПО (предприятий и организаций); ОКОНХ (отраслей народного хозяйства); ОКУД (управленческой документации); ОКП (промышленной и сельскохозяйственной продукции); СОАТО (объектов административно-территориального деления и населенных пунктов); КФС (форм собственности) и др. Наличие классификаторов обеспечивает возможность построения эффективных логических систем кодирования экономической информации. Используемые для этих целей формы построения кодов подразделяются на линейные (одномерные) и шахматные. В линейных кодах условное обозначение соответствует только одной единице информации, в шахматных используются двухпозиционные коды, одновременно отражается характеристика двух информационных единиц (по строке и столбцу). Все коды строятся по определенным правилам (системам). Системой кодирования называется строго определенный порядок присвоения условных обозначений единицам информации. По способу построения линейные системы кодирования различают как: порядковые, серийные, позиционные (разрядные, или десятичные), повторения, смешанные (комбинированные).^ Порядковая система кодирования предполагает последовательное присвоение условных обозначений кодируемым единицам информации. Специальной классификации информации, как правило, не требуется. Последовательность кодов задается прежде всего хронологией возникновения информационных единиц, но чаще всего объектом кодирования выступает информация, упорядоченная (систематизированная) по алфавиту. При порядковой системе кодирования единицам призначной части информации последовательно присваиваются обозначения чисел натурального ряда в порядке его возрастания (реже убывания). Ни одна позиция массива (или кодируемой номенклатуры информации) при этом не пропускается. Порядковая система исключает возможность получения каких-либо промежуточных (внутренних) итогов по массиву (номенклатуре), поэтому ею пользуются ограниченно, лишь для небольших, а главное, устойчивых номенклатур или массивов, содержащих незначительное число информационных единиц. Достоинством данной системы является компактность, а недостатками - невозможность формирования промежуточных итогов и практически полное отсутствие возможности расширения списка кодируемой номенклатуры (вследствие нарушения логики его построения).^ Серийная система кодирования ориентирована на разделение номенклатуры по какому-либо признаку на отдельные части (серии). За каждой серией закрепляется своя группа условных обозначений (чисел, называемых номерами). При этом номера единиц информации последующих серий не продолжают последовательно номера уже имеющихся единиц предыдущей серии, в результате создается определенный разрыв номеров, используемый в качестве резерва для последующего расширения (в случае необходимости) номенклатуры кодируемых позиций в каждой серии без нарушения общей логики построения списка. Серийный код обеспечивает возможность получения промежуточных итогов по сериям, но только в пределах одного классификационного признака, а также сохранение принципов серийности при расширении кодируемой номенклатуры по установленному классификационному признаку, но лишь в пределах выделенных резервных позиций. Данная система удобна для относительно устойчивых и небольших позиций номенклатур, например, по ней строятся коды оплат (доплат) и удержаний.Финансовая газета. Региональный выпуск.Сентябрь. №36, 2005, стр. 15.^ КЛАССИФИКАЦИЯ И КОДИРОВАНИЕ КАК СРЕДСТВА ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ(Окончание. Начало см. в № 34, 35) Позиционная (разрядная, десятичная) система кодирования предполагает иерархическую структуру представления информации или разделение ее по нескольким соподчиненным признакам. Сущность данной системы заключается в том, что каждый уровень (или признак) классификации обеспечивается своей нумерацией в пределах всего уровня или признака (группы информации). При этом устанавливается предел разрядности группы и выбирается ее некоторая кратность. Позиционная система применяется для кодирования сложных составных (иерархических) номенклатур, в которых, как правило, каждый реквизит, характеризующий низший уровень классификации, получает ряд характеристик, отражающих его принадлежность к более высокому уровню классификации. Позиционный код удобен для решения задач, связанных с необходимостью получения частных итогов по различным уровням иерархии. Позиционный код нагляден, но достаточно громоздок и, как правило, обладает излишней избыточностью. Позиционные системы подразделяются на поразрядно-последовательные, в которых для каждого уровня иерархии отводится только один разряд, характеризующий этот уровень, и поразрядно-порядковые, в которых некоторым уровням иерархии отводится несколько разрядов, причем многоразрядные обозначения даются последовательно (по порядку). В этом плане поразрядно-порядковая система может рассматриваться как продолжение поразрядно-последовательной. Чаще всего в позиционных кодах поразрядный принцип сочетается с порядковым, реже - с серийным. Например, в Плане счетов бухгалтерского учета синтетические счета кодируются двухзначными цифрами от 01 до 99 (т.е. выделением двух разрядов), а субсчета - трехзначными, из которых первые два разряда выделяются для обозначения номера синтетического счета (используется серийная система кодирования), а третий - номер субсчета (применяется порядковая система кодирования). При этом осуществляется следующее распределение номеров (серий) по разделам Плана счетов бухгалтерского учета: 01-09 Внеоборотные активы; 10-19 Производственные запасы; 20-39 Затраты на производство; 40-49 Готовая продукция и товары; 50-59 Денежные средства; 60-79 Расчеты; 80-89 Капитал; 90-99 Финансовые результаты.Х Х Х ^ ^ I I I I_______- номер субсчета I I____________-номер синтетического счета^ Рис. 4. Структура кода счетов бухгалтерского учетаКроме того, позиционные системы подразделяются на зависимые и независимые, а также по кратности разрядов. В зависимых системах кодовые обозначения младших уровней взаимосвязаны по смыслу с обозначениями старших (предшествующих) уровней, в независимых такая связь отсутствует. По критерию кратности разрядности наиболее распространены десятичные позиционные системы, поэтому иногда позиционные системы называют десятичными. При десятичном варианте системы каждая позиция (разряд) может содержать коды от 0 до 9. Построение кодов по системе повторения имеет весьма ограниченное распространение в организационно-экономическом управлении, хотя обладает важным достоинством - характеризует количественные параметры информации, воспроизводя их значение в подлинном или условном виде, но обязательно несущем определенную смысловую нагрузку, например кодирование проб драгоценных металлов для ювелирных изделий: золото (Au) - 375, 500, 583, 585, 750, 916, 958, 999; серебро (Ag) - 800, 875, 916, 925, 960, 999; платина (Pt) - 950, 999; палладий (Pd) - 500, 850, 999, когда код (проба) отражает содержание драгоценного металла (в тысячных долях) в сплаве (например, золото 583-й пробы означает содержание 58,3% чистого золота в сплаве). На практике системы кодирования могут быть построены на основе как одного общего принципа для всех идентифицируемых характеристик кодируемой номенклатуры, так и сочетания разных принципов (путем добавления к базовому принципу какого-либо другого принципа). Такие системы называются смешанными, или комбинированными, системами кодирования. Чаще всего в них сочетается поразрядная (десятичная) система с серийной, реже с системой повторения.2>2>1>1>