Реферат по предмету "Информатика, программирование"


Информационно-поисковые тезаурусы

ТЕМА:ИНФОРМАЦИОННО-ПОИСКОВЫЕ ТЕЗАУРУСЫ

1.Информационно-посковый тезаурус
Словари типа тезаурус илиидеографические впервые разработаны в лингвистике. Тезаурусы предназначены дляоблегчения поиска языковых средств выражающих данное понятие (идею).Классическим примером поискового тезауруса является: тезаурус английских слов ивыражений первое издание которого было подготовлено Роджестоном 1852 г. подобные тезаурусы созданы и для других естественных языков. Лингвистический тезаурусразработан в связи с автоматизированной подготовкой текста.
Синтагматическиесвязи – этосоотношение единицы языка в данном высказывании.
В институте русскогоязыка РАН создан тезаурус семантических (смысловых) и синтагматических связеймежду словами и словосочетаниями, русский язык как словарно-программноесредство. Объём тезауруса 64 000 слов и словосочетаний.
ИПТ предназначен:
1.        обеспечиватьперевод с естественного языка на дескрипторный т.е для координатногоиндексирования документов и запросов.
2.        отражатьпарадигматические отношения между лексическими единицами ИПТ, которыеиспользуются при составлении стратегии поиска.
Парадигматическиеотношения- этологические и ассоциативные отношения между ЛЕ ИПЯ.
3.        служитьтерминологическим пособием.
ИПТ – это нормативный словарьдескрипторного ИПЯ с зафиксированными в нём парадигматическими отношениями ЛЕ.
Многоязычный ИПТ – это ИПТ содержащие ЛЕ взятые из несколькихестественных языков и представляющий эквивалентные по смыслу понятия на каждомиз этих языков.
Целью создания ИПТявляется повышение показателя поиска информации в ИПТ.
Макротезаурус – ИПТ включающий ЛЕ высокой общности ипокрывающий широкую область знания.
Микротезаурус – специализированный ИПТ небольшогообъёма составленный на основе выборки из более полного ИПТ и дополнительновключающий конкретные русские понятия определённой тематики.
СпециализированныйИПТ или синониммонотематического ИПТ – ИПТ построенный для отражения области знания илипрактической деятельности.
ПолитематическийИПТ – ИПТпостроенный для широкой совокупности областей знания.
СпециализированныйИПТ – существуетв большинстве науки и техники.
Количестворазработанных микротезаурусов исчисляется только в нашей стране в несколькотысяч.
Макротезаурус иполитематический ИПТ – предназначены для использования лексико-тематической основы припостроении микротезауруса.
Политематический ИПТвключает только основную лексику той или иной отрасли и наиболее очевидныепарадигматические отношения.
Микротезаурус включаетспецифические термины собствен. наимен. и развитую парадигмат.
В состав ИПТ входитвводная часть, основная часть (лексико-семантический указатель) идополнительные части.
Вводная часть включаеттитульный лист и текстовые введения.
Введение содержитследующие данные:
1.   цель создания и область примененияИПТ;
2.        ссылки наисточники используемые для сбора лексики ИПТ (др. ИПТ, терминологическиесловари);
3.        описание порядкасоставления ИПТ;
4.        описание составаи структуры ИПТ;
5.        количественныехарактеристики ИПТ (общее число статей, число дескрипторов и аскрипторов);
6.        переченьотношений между ЛЕ и методикой основания для их установления.
7.        перечень всехсимволов и специальных сокращений допустимых для представления ЛЕ.
8.        порядокалфавитного расположения ЛЕ.
9.        описание составаи формы представления дополнительных данных в словарных статьях.
Лексико-семантическийуказатель – этоосновная часть ИПТ в которой в едином алфавитном ряду перечислены вседескрипторы и аскрипторы с указанием их парадигматических отношений.
ЛЕ ИПТ – слово, словосочетание, илилексическое значение компонентов сложного слова естественного языка включённоев ИПТ в качестве дескриптора или аскриптора.
Аскриптор (недескриптор) – ЛЕИПТ которая в поисковых образах документов (запросов) подлежит замене надескриптор при поиске или обработке информации.
В рамкахдескрипторной статьи термины располагаются в следующем порядке:
1.        заглавныйдескриптор выделен при помощи шрифта. Например заглавными буквами;
2.            дополнительныеданные;
3.        лексическоепримечание (краткое объяснение уточнение значения дескриптора);
4.        аскрипторы илидескрипторы синонимы (которые следуют за индексом «С»);
5.        вышестоящиедескрипторы следующие за индексом «в»;
6.        нижестоящиедескрипторы следующие за индексом «а»;
7.        дескрипторысвязанные другими видами отношений.
Вышестоящийдескриптор, широкийдескриптор- это дескриптор обозначающий либо родовое понятие, либо целое поотношению к данному дескриптору обозначающий часть этого целого.
Нижестоящийдескриптор или узкий дескриптор — дескриптор обозначающий либо видовое понятие, либо частьпредставляющую вышестоящий дескриптор.Ассоциативный дескриптор– дескриптор связанный с другими семантической связью характеркоторой не указан.
Основными типами связиявляется: причина-следствие, процесс-объект, функциональное сходство,антонимия.
Неоднозначность ЛЕустраняется релятором или лексическим примечанием.
Релятор является ЛЕ ипоясняет её значение относя её к определённой понятийной категории илипредметно-тематической области.
Дополнительныечасти ИПТ:
-          систематическийуказатель;
-          иерархический идругие указатели и списки специальных категорий ЛЕ.
Дополнительныеуказатели служат для раскрытия учёта и контроля парадигматических отношениймежду дескрипторами, что требуется при составлении поисковых предписаний.
Спискиуказателей являются перечнем дескрипторов сгруппированных согласно принятой вИПТ рубрикации.
Припостроении систематического указателя используется следующая общая категория:
1.   название дисциплин и отраслейдеятельности;
2.   предметы, материалы;
3.   методы, процессы, операции, явления;
4.   свойства, величины, параметры,характеристики;
5.   отношения структуры, модели, законы,правила, абстрактные понятия.
Каждыйдескриптор относится только к одной рубрике. Внутри рубрики дескрипторрасполагается в алфавитном порядке.
Иерархический– представляетсобой перечень списков дескрипторов, причём каждый список начинается сдескриптора не имеющего вышестоящих.
После каждогодескриптора приведены непосредственно нижестоящие дескрипторы с указаниемиерархических, путём применения нумерации. Либо графические обозначения уровня.
Основныепреимущества дескрипторных ИПЯ:
Меньшая посравнению с классификационным ИПЯ трудоёмкость разработки;
Возможностьосуществить поиск по любому заранее заданному сочетанию характеристик входящихв ИПЯ;
Возможностьавтоматического процесса индексирования документов.
Недостаткидескрипторных ИПЯ:
В основныхотраслях характер дескрипторного ИПЯ затрудняет их использование для обменаинформацией между системами с различными ИПЯ;
Неадекватноезначение термина выбран в качестве дескриптора в различных дескрипторных ИПС.

2. Анализинформационно-поискового тезауруса
 
2.1Информационно-поисковый тезаурус по сохранности документов (БАН)
1. Первый отечественныйдвуязычный тезаурус по сохранности документов, подготовленный в БиблиотекеРоссийской академии наук. тезаурус насчитывает 5 166 терминов.
Издание представляетсобой образец смешанного двуязычного (русско-английского) тезауруса. Основнымязыком выбран английский. Это значит, что в качестве дескрипторов выбраныанглийские термины, а русские термины приводятся как синонимы.
Настоящийинформационно-поисковый тезаурус предназначен для индексирования документов иобработки запросов по обеспечению сохранности (хранению) документов втрадиционных и нетрадиционных информационных системах. Тезаурус можетиспользоваться как специальный двуязычный словарь при выполнении переводов срусского на английский и с английского на русский язык, а также кактерминологический словарь справочник.
В состав тезаурусавходят:
— лексико-семантическийуказатель;
— иерархическийуказатель;
— хронологическийидентификатор.
2. Дескрипторы часто определяют как классы условной эквивалентноститерминов, поскольку имеется поисковая и обычная (общеязыковая) эквивалентностьязыковых единиц, и эти два вида лексической равнозначности терминов вдескрипторных словарях могут не полностью совпадать. Так, например, улексических единиц, входящих в дескриптор «DERATISATION c. Дератизация, н.MICE, RATS», содержание понятий «мыши» и «крысы» относятся к семантическимкатегориям «живые организмы», «биологический фактор», а понятие «дератизация» –к лексической категории «операции». Но поскольку при проведении поиска информацииразличия в категориальном значении указанных слов являются не оченьсущественными и более важным является их информационно-поисковаяэквивалентность, в тезаурусе по сохранности документов понятия «мыши» и «крысы»являются нижестоящими по отношению к термину «deratisation».
В лексико-семантическомуказателе тезауруса расположены дескрипторные и аскрипторные статьи.
В рамках дескрипторнойстатьи термины располагаются в следующем порядке:
— заглавные дескрипторывыделены заглавными буквами;
— дополнительные данные;
— аскрипторы илидескрипторы синонимы, которые следуют за индексом «с»;
— вышестоящие дискрипторыследующие за индексом «в»;
— нижестоящие дескрипторыследующие за индексом «н».
Пример:
ACCTSS CONTROL
c Visitors control
Контроль и управлениедоступом
в ORGANIZATION OFSECURITY SISTEMS
н ACCESS CONTROL
3. В дескрипторныхстатьях тезауруса отсутствуют:
— лексическое примечание;
 - дескрипторы связанныедругими видами отношений.
 

2.2 Тезаурус терминовпо морскому делу и парусному туризму. (информационно-поисковый тезаурус). СоставительВ.Н. Белозеров. Москва 2001
1. Тезаурус содержитоколо 2200 терминов с определениями и тезаурусными связями.
Настоящийсловарь-справочник по морскому делу и парусному туризму являетсятерминологическим словарем, в котором для каждого термина дано его определение,при необходимости — примечания о характере использования, а также семантическиесвязи с другим понятиями.
Наличие явного указанияна семантические связи понятий в совокупности с раскрытием их содержания вопределениях и комментариях позволяет использовать словарь как«программированный учебник», который ведет читателя от слова к слову,сообщая сведения о понятиях всей сферы интереса.
В состав словаря входитвся специальная терминология, необходимая для изложения материала поорганизации и проведению туристских плаваний на транспортабельных разборныхсудах по внутренним водоемам и прибрежным районам морей. Терминология этоговида деятельности дополнена лексикой классического парусного дела, парусногоспорта, навигации, гидрографии, организации морских перевозок, что позволяет использоватьсловарь как справочник по морскому делу в целом.
Словарь состоит изнастоящего введения и алфавитного лексико-семантического указателятерминологии. Элементом алфавитного указателя является словарная статья,состоящая из заглавной лексической единицы, определения, примечания и ссылок.
Тематику словаря можноотнести к следующим рубрикам Государственного рубрикатора научно-техническойинформации:
·          71.37.01 Общиевопросы туристско-экскурсионного обслуживания
·          73.34.01 Общиевопросы водного транспорта
·          77.01.33Терминология. Справочники, словари, учебная литература по физической культуре испорту
·          77.29.32 Парусныйспорт. Виндсерфинг
·          77.29.33Спортивный туризм
2. Заглавная лексическаяединица возглавляет словарную статью и в дескрипторных статьях выделеназаглавными (прописными) буквами. В некоторых случаях в состав заглавнойлексической единицы включены факультативные пояснительные слова в круглыхскобках. Например: «УЗЕЛ (скорость)» в отличие от «УЗЕЛ (натросе)».
Определение следуетнепосредственно после заглавной лексической единицы, отделено от нее тире инабрано шрифтом с уменьшенной высотой букв (в настоящем варианте петит нереализован). В некоторых случаях, когда определение термина очевидно из еговнутренней формы, оно не приводится. В тех же случаях, когда термин можноопределить с разных сторон и лишь в совокупности соответствующие определенияописывают понятие, приводятся два или даже три определения, разделенные точкойс запятой.
Например:
обычноеопределение:
КЛИВЕР —треугольный косой парус, передняя шкаторина которого крепится к кливер-лееру,соединяющему стеньгу с ноком бушприта или утлегарем.
определениеопущено:
ДАЛЬНОСТЬВИДИМОСТИ —
дваопределения (со стороны значения и со стороны формы):
АЗ — флагВМСС, обозначающий русскую букву А; красный с косицами и белым квадратом удревка.
Важной частью статьиявляются ссылки на другие термины или другие формы того же термина. Онипозволяют знакомиться с содержанием тезауруса методом «навигации» поссылкам и уточняют значение терминов, дополнительно раскрывая его через связитермина (набранного обычным светлым шрифтом). Если в статье приводится два илиболее ссылочных термина, имеющих одинаковый характер связи с заглавнойлексической единицей, обозначение ссылки приводится только один раз в первой изстрок.
Все термины, указанные вссылках, являются заглавными лексическими единицами соответствующих статей, вкоторых можно получить дополнительную информацию о данном термине. Исключениесоставляют ссылки на обозначения и аббревиатуры.
В настоящем тезаурусеиспользуются следующие виды ссылок, которые располагаются в указанном нижепорядке:
с — в дескрипторнойстатье указывает на синонимичный аскриптор;
см — в аскрипторнойстатье указывает на синонимичный дескриптор;
исп — в аскрипторнойстатье указывает на несколько дескрипторов, среди которых нужно выбрать один,наиболее точно выражающий интересующее читателя понятие;
об — условное обозначениеданного понятия;
вр — вышестоящее родовоепонятие;
вц — вышестоящий термин,обозначающий объект, включающий в себя данное понятие в качестве своейсоставной части;
вм — множество, один изэлементов которого обозначается заглавной лексической единицей;
нв — нижестоящее видовоепонятие;
нч — нижестоящий термин,обозначающий часть объекта, выраженного заглавной лексической единицей;
нэ — нижестоящий термин,обозначающий один из элементов множества, выраженного заглавной лексическойединицей;
асх — ассоциация посходству объектов или понятий; асм — ассоциация по смежности объектов,процессов или явлений; ант — антоним, т.е. «противоположное» понятие;
ср — ссылка на аскриптор,предлагающий данную заглавную лексическую единицу в качестве одной изальтернатив для выбора точного термина.
Пример:
АЗИМУТ — направление впространстве, выраженное относительно стран света
вр: направление
нв: азимут светила;истинный азимут; компасный азимут; магнитный азимут;
асх: пеленг; румб
асм: круговая системаазимутов; румбовая система азимутов; четвертная система азимутов
3. Настоящий словарь,рассматриваемый как тезаурус, подготовлен в соответствии с ГОСТ 7.25 — 80.

СПИСОК ЛИТЕРАТУРЫ
1. ГОСТ 7.24-90. Тезаурус информационно-поисковыймногоязычный.
2. ГОСТ 7.25-2001. Тезаурусинформационно-поисковый одноязычный.
3. ГОСТ 7.74-96. Информационно-поисковые языки.Термины и определения.


Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.

Сейчас смотрят :

Реферат Потребительское поведение. Закон убывающей предельной полезности
Реферат Культурология - как научная дисциплина
Реферат Алгоритмизация обучения
Реферат Петр Капица (english)
Реферат Экзаменационные тесты по офтальмологии 4 курс
Реферат Анализ развития коммерческого кредита в современной России состояние проблемы перспективы
Реферат Металлы и сплавы, применяемые в полиграфии
Реферат Роль эпизода в поэме Н.В. Гоголя «Мёртвые души» «Чичиков у Ноздрёва».
Реферат Политические взгляды Ж-Ж Руссо
Реферат Произведение Грибоедова "Горе от ума" — комедия или трагедия?
Реферат Автореферат диссертации на соискание степени
Реферат Ирландская республиканская армия 1919 1922
Реферат Финансовый анализ эффективности системы управления качеством
Реферат Понятие информации. Свойства информации. Обработка информации
Реферат Цех разлива пива под давлением