Реферат по предмету "Информатика, программирование"


Информационно-поисковые тезаурусы

ТЕМА:ИНФОРМАЦИОННО-ПОИСКОВЫЕ ТЕЗАУРУСЫ

1.Информационно-посковый тезаурус
Словари типа тезаурус илиидеографические впервые разработаны в лингвистике. Тезаурусы предназначены дляоблегчения поиска языковых средств выражающих данное понятие (идею).Классическим примером поискового тезауруса является: тезаурус английских слов ивыражений первое издание которого было подготовлено Роджестоном 1852 г. подобные тезаурусы созданы и для других естественных языков. Лингвистический тезаурусразработан в связи с автоматизированной подготовкой текста.
Синтагматическиесвязи – этосоотношение единицы языка в данном высказывании.
В институте русскогоязыка РАН создан тезаурус семантических (смысловых) и синтагматических связеймежду словами и словосочетаниями, русский язык как словарно-программноесредство. Объём тезауруса 64 000 слов и словосочетаний.
ИПТ предназначен:
1.        обеспечиватьперевод с естественного языка на дескрипторный т.е для координатногоиндексирования документов и запросов.
2.        отражатьпарадигматические отношения между лексическими единицами ИПТ, которыеиспользуются при составлении стратегии поиска.
Парадигматическиеотношения- этологические и ассоциативные отношения между ЛЕ ИПЯ.
3.        служитьтерминологическим пособием.
ИПТ – это нормативный словарьдескрипторного ИПЯ с зафиксированными в нём парадигматическими отношениями ЛЕ.
Многоязычный ИПТ – это ИПТ содержащие ЛЕ взятые из несколькихестественных языков и представляющий эквивалентные по смыслу понятия на каждомиз этих языков.
Целью создания ИПТявляется повышение показателя поиска информации в ИПТ.
Макротезаурус – ИПТ включающий ЛЕ высокой общности ипокрывающий широкую область знания.
Микротезаурус – специализированный ИПТ небольшогообъёма составленный на основе выборки из более полного ИПТ и дополнительновключающий конкретные русские понятия определённой тематики.
СпециализированныйИПТ или синониммонотематического ИПТ – ИПТ построенный для отражения области знания илипрактической деятельности.
ПолитематическийИПТ – ИПТпостроенный для широкой совокупности областей знания.
СпециализированныйИПТ – существуетв большинстве науки и техники.
Количестворазработанных микротезаурусов исчисляется только в нашей стране в несколькотысяч.
Макротезаурус иполитематический ИПТ – предназначены для использования лексико-тематической основы припостроении микротезауруса.
Политематический ИПТвключает только основную лексику той или иной отрасли и наиболее очевидныепарадигматические отношения.
Микротезаурус включаетспецифические термины собствен. наимен. и развитую парадигмат.
В состав ИПТ входитвводная часть, основная часть (лексико-семантический указатель) идополнительные части.
Вводная часть включаеттитульный лист и текстовые введения.
Введение содержитследующие данные:
1.   цель создания и область примененияИПТ;
2.        ссылки наисточники используемые для сбора лексики ИПТ (др. ИПТ, терминологическиесловари);
3.        описание порядкасоставления ИПТ;
4.        описание составаи структуры ИПТ;
5.        количественныехарактеристики ИПТ (общее число статей, число дескрипторов и аскрипторов);
6.        переченьотношений между ЛЕ и методикой основания для их установления.
7.        перечень всехсимволов и специальных сокращений допустимых для представления ЛЕ.
8.        порядокалфавитного расположения ЛЕ.
9.        описание составаи формы представления дополнительных данных в словарных статьях.
Лексико-семантическийуказатель – этоосновная часть ИПТ в которой в едином алфавитном ряду перечислены вседескрипторы и аскрипторы с указанием их парадигматических отношений.
ЛЕ ИПТ – слово, словосочетание, илилексическое значение компонентов сложного слова естественного языка включённоев ИПТ в качестве дескриптора или аскриптора.
Аскриптор (недескриптор) – ЛЕИПТ которая в поисковых образах документов (запросов) подлежит замене надескриптор при поиске или обработке информации.
В рамкахдескрипторной статьи термины располагаются в следующем порядке:
1.        заглавныйдескриптор выделен при помощи шрифта. Например заглавными буквами;
2.            дополнительныеданные;
3.        лексическоепримечание (краткое объяснение уточнение значения дескриптора);
4.        аскрипторы илидескрипторы синонимы (которые следуют за индексом «С»);
5.        вышестоящиедескрипторы следующие за индексом «в»;
6.        нижестоящиедескрипторы следующие за индексом «а»;
7.        дескрипторысвязанные другими видами отношений.
Вышестоящийдескриптор, широкийдескриптор- это дескриптор обозначающий либо родовое понятие, либо целое поотношению к данному дескриптору обозначающий часть этого целого.
Нижестоящийдескриптор или узкий дескриптор — дескриптор обозначающий либо видовое понятие, либо частьпредставляющую вышестоящий дескриптор.Ассоциативный дескриптор– дескриптор связанный с другими семантической связью характеркоторой не указан.
Основными типами связиявляется: причина-следствие, процесс-объект, функциональное сходство,антонимия.
Неоднозначность ЛЕустраняется релятором или лексическим примечанием.
Релятор является ЛЕ ипоясняет её значение относя её к определённой понятийной категории илипредметно-тематической области.
Дополнительныечасти ИПТ:
-          систематическийуказатель;
-          иерархический идругие указатели и списки специальных категорий ЛЕ.
Дополнительныеуказатели служат для раскрытия учёта и контроля парадигматических отношениймежду дескрипторами, что требуется при составлении поисковых предписаний.
Спискиуказателей являются перечнем дескрипторов сгруппированных согласно принятой вИПТ рубрикации.
Припостроении систематического указателя используется следующая общая категория:
1.   название дисциплин и отраслейдеятельности;
2.   предметы, материалы;
3.   методы, процессы, операции, явления;
4.   свойства, величины, параметры,характеристики;
5.   отношения структуры, модели, законы,правила, абстрактные понятия.
Каждыйдескриптор относится только к одной рубрике. Внутри рубрики дескрипторрасполагается в алфавитном порядке.
Иерархический– представляетсобой перечень списков дескрипторов, причём каждый список начинается сдескриптора не имеющего вышестоящих.
После каждогодескриптора приведены непосредственно нижестоящие дескрипторы с указаниемиерархических, путём применения нумерации. Либо графические обозначения уровня.
Основныепреимущества дескрипторных ИПЯ:
Меньшая посравнению с классификационным ИПЯ трудоёмкость разработки;
Возможностьосуществить поиск по любому заранее заданному сочетанию характеристик входящихв ИПЯ;
Возможностьавтоматического процесса индексирования документов.
Недостаткидескрипторных ИПЯ:
В основныхотраслях характер дескрипторного ИПЯ затрудняет их использование для обменаинформацией между системами с различными ИПЯ;
Неадекватноезначение термина выбран в качестве дескриптора в различных дескрипторных ИПС.

2. Анализинформационно-поискового тезауруса
 
2.1Информационно-поисковый тезаурус по сохранности документов (БАН)
1. Первый отечественныйдвуязычный тезаурус по сохранности документов, подготовленный в БиблиотекеРоссийской академии наук. тезаурус насчитывает 5 166 терминов.
Издание представляетсобой образец смешанного двуязычного (русско-английского) тезауруса. Основнымязыком выбран английский. Это значит, что в качестве дескрипторов выбраныанглийские термины, а русские термины приводятся как синонимы.
Настоящийинформационно-поисковый тезаурус предназначен для индексирования документов иобработки запросов по обеспечению сохранности (хранению) документов втрадиционных и нетрадиционных информационных системах. Тезаурус можетиспользоваться как специальный двуязычный словарь при выполнении переводов срусского на английский и с английского на русский язык, а также кактерминологический словарь справочник.
В состав тезаурусавходят:
— лексико-семантическийуказатель;
— иерархическийуказатель;
— хронологическийидентификатор.
2. Дескрипторы часто определяют как классы условной эквивалентноститерминов, поскольку имеется поисковая и обычная (общеязыковая) эквивалентностьязыковых единиц, и эти два вида лексической равнозначности терминов вдескрипторных словарях могут не полностью совпадать. Так, например, улексических единиц, входящих в дескриптор «DERATISATION c. Дератизация, н.MICE, RATS», содержание понятий «мыши» и «крысы» относятся к семантическимкатегориям «живые организмы», «биологический фактор», а понятие «дератизация» –к лексической категории «операции». Но поскольку при проведении поиска информацииразличия в категориальном значении указанных слов являются не оченьсущественными и более важным является их информационно-поисковаяэквивалентность, в тезаурусе по сохранности документов понятия «мыши» и «крысы»являются нижестоящими по отношению к термину «deratisation».
В лексико-семантическомуказателе тезауруса расположены дескрипторные и аскрипторные статьи.
В рамках дескрипторнойстатьи термины располагаются в следующем порядке:
— заглавные дескрипторывыделены заглавными буквами;
— дополнительные данные;
— аскрипторы илидескрипторы синонимы, которые следуют за индексом «с»;
— вышестоящие дискрипторыследующие за индексом «в»;
— нижестоящие дескрипторыследующие за индексом «н».
Пример:
ACCTSS CONTROL
c Visitors control
Контроль и управлениедоступом
в ORGANIZATION OFSECURITY SISTEMS
н ACCESS CONTROL
3. В дескрипторныхстатьях тезауруса отсутствуют:
— лексическое примечание;
 - дескрипторы связанныедругими видами отношений.
 

2.2 Тезаурус терминовпо морскому делу и парусному туризму. (информационно-поисковый тезаурус). СоставительВ.Н. Белозеров. Москва 2001
1. Тезаурус содержитоколо 2200 терминов с определениями и тезаурусными связями.
Настоящийсловарь-справочник по морскому делу и парусному туризму являетсятерминологическим словарем, в котором для каждого термина дано его определение,при необходимости — примечания о характере использования, а также семантическиесвязи с другим понятиями.
Наличие явного указанияна семантические связи понятий в совокупности с раскрытием их содержания вопределениях и комментариях позволяет использовать словарь как«программированный учебник», который ведет читателя от слова к слову,сообщая сведения о понятиях всей сферы интереса.
В состав словаря входитвся специальная терминология, необходимая для изложения материала поорганизации и проведению туристских плаваний на транспортабельных разборныхсудах по внутренним водоемам и прибрежным районам морей. Терминология этоговида деятельности дополнена лексикой классического парусного дела, парусногоспорта, навигации, гидрографии, организации морских перевозок, что позволяет использоватьсловарь как справочник по морскому делу в целом.
Словарь состоит изнастоящего введения и алфавитного лексико-семантического указателятерминологии. Элементом алфавитного указателя является словарная статья,состоящая из заглавной лексической единицы, определения, примечания и ссылок.
Тематику словаря можноотнести к следующим рубрикам Государственного рубрикатора научно-техническойинформации:
·          71.37.01 Общиевопросы туристско-экскурсионного обслуживания
·          73.34.01 Общиевопросы водного транспорта
·          77.01.33Терминология. Справочники, словари, учебная литература по физической культуре испорту
·          77.29.32 Парусныйспорт. Виндсерфинг
·          77.29.33Спортивный туризм
2. Заглавная лексическаяединица возглавляет словарную статью и в дескрипторных статьях выделеназаглавными (прописными) буквами. В некоторых случаях в состав заглавнойлексической единицы включены факультативные пояснительные слова в круглыхскобках. Например: «УЗЕЛ (скорость)» в отличие от «УЗЕЛ (натросе)».
Определение следуетнепосредственно после заглавной лексической единицы, отделено от нее тире инабрано шрифтом с уменьшенной высотой букв (в настоящем варианте петит нереализован). В некоторых случаях, когда определение термина очевидно из еговнутренней формы, оно не приводится. В тех же случаях, когда термин можноопределить с разных сторон и лишь в совокупности соответствующие определенияописывают понятие, приводятся два или даже три определения, разделенные точкойс запятой.
Например:
обычноеопределение:
КЛИВЕР —треугольный косой парус, передняя шкаторина которого крепится к кливер-лееру,соединяющему стеньгу с ноком бушприта или утлегарем.
определениеопущено:
ДАЛЬНОСТЬВИДИМОСТИ —
дваопределения (со стороны значения и со стороны формы):
АЗ — флагВМСС, обозначающий русскую букву А; красный с косицами и белым квадратом удревка.
Важной частью статьиявляются ссылки на другие термины или другие формы того же термина. Онипозволяют знакомиться с содержанием тезауруса методом «навигации» поссылкам и уточняют значение терминов, дополнительно раскрывая его через связитермина (набранного обычным светлым шрифтом). Если в статье приводится два илиболее ссылочных термина, имеющих одинаковый характер связи с заглавнойлексической единицей, обозначение ссылки приводится только один раз в первой изстрок.
Все термины, указанные вссылках, являются заглавными лексическими единицами соответствующих статей, вкоторых можно получить дополнительную информацию о данном термине. Исключениесоставляют ссылки на обозначения и аббревиатуры.
В настоящем тезаурусеиспользуются следующие виды ссылок, которые располагаются в указанном нижепорядке:
с — в дескрипторнойстатье указывает на синонимичный аскриптор;
см — в аскрипторнойстатье указывает на синонимичный дескриптор;
исп — в аскрипторнойстатье указывает на несколько дескрипторов, среди которых нужно выбрать один,наиболее точно выражающий интересующее читателя понятие;
об — условное обозначениеданного понятия;
вр — вышестоящее родовоепонятие;
вц — вышестоящий термин,обозначающий объект, включающий в себя данное понятие в качестве своейсоставной части;
вм — множество, один изэлементов которого обозначается заглавной лексической единицей;
нв — нижестоящее видовоепонятие;
нч — нижестоящий термин,обозначающий часть объекта, выраженного заглавной лексической единицей;
нэ — нижестоящий термин,обозначающий один из элементов множества, выраженного заглавной лексическойединицей;
асх — ассоциация посходству объектов или понятий; асм — ассоциация по смежности объектов,процессов или явлений; ант — антоним, т.е. «противоположное» понятие;
ср — ссылка на аскриптор,предлагающий данную заглавную лексическую единицу в качестве одной изальтернатив для выбора точного термина.
Пример:
АЗИМУТ — направление впространстве, выраженное относительно стран света
вр: направление
нв: азимут светила;истинный азимут; компасный азимут; магнитный азимут;
асх: пеленг; румб
асм: круговая системаазимутов; румбовая система азимутов; четвертная система азимутов
3. Настоящий словарь,рассматриваемый как тезаурус, подготовлен в соответствии с ГОСТ 7.25 — 80.

СПИСОК ЛИТЕРАТУРЫ
1. ГОСТ 7.24-90. Тезаурус информационно-поисковыймногоязычный.
2. ГОСТ 7.25-2001. Тезаурусинформационно-поисковый одноязычный.
3. ГОСТ 7.74-96. Информационно-поисковые языки.Термины и определения.


Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.