А) Немного общей теории о том, что такое «тезаурус» и откуда он произошел.
В начале 60-х гг. Ю.А. Шрейдер предпринял попытку разработать методы определения того, как богатство состава и структурность информации, накопленной в объекте, влияют на её прием и эффективность обработки для использования. Это было связано с задачами оптимизации управления. Так появилась семантическая теория информации, развитая Ю.А. Шрейдером, которая отличается от теории информации К. Шеннона по своим исходным положениям. В теории Шрейдера акцент делается на свойствах приемника, воспринимающего и накапливающего информацию, и на оценке её семантического (смыслового) значения, а вопрос о канале передачи информации уходит на второй план. Основная идея семантической теории информации заключается в том, что семантическую информацию, воспринимаемую данной системой, можно оценивать по степени изменения содержащейся в системе собственной семантической информации за счет накопления внешней информации.
Чтобы вообще воспринять какую-либо информацию от внешних источников, система-приемник должна обладать неким минимальным «запасом знаний», который обозначается термином «тезаурус», или, иначе говоря, система должна содержать некую начальную, пороговую внутреннюю информацию. Если позволяет эта пороговая информация, система способна расширять свой тезаурус, извлекая извне все более обширную информацию, вплоть до максимально для нее доступной, когда её внутренняя информация (тезаурус) обогащается до оптимального уровня. Дальнейшее восприятие информации становится для системы все более избыточным (все менее значимым) и, наконец, она уже «знает все, что ей доступно», — её внутренняя информация (тезаурус) становится насыщенной.
Б) Тезаурус в справочно-правовых базах данных.
В основе создания баз данных, основанных на текстовой информации, лежит первоначальное формирование словарей (тезаурусов) для описания признаков искомых запросов. Чем точнее и полнее описываются признаки, тем более эффективным является поиск по автоматизированным информационным системам.
Возьмем например, справочную базу «Сейф» (используется в правоохранительных органах). Эффективность её функционирования определяется подробным словарем, в котором описываются разнообразные способы и орудия взлома. Тезаурусы должны быть одинаковыми для различных регионов и стран. Только в этом случае разные базы данных будут кооперироваться между собой и между ними можно будет производить обмен информацией и вести поиск одновременно в нескольких странах.