Машиночитаемый каталог или каталогизация ВВЕДЕНИЕ. Термин MARC представляет собой акроним названия системы Machine- Readable Catalogue or Cataloguing Машиночитаемый каталог или каталогизация. Однако это название не совсем точно, поскольку MARC не является ни каким-либо видом каталога, ни методом каталогизации. Фактически MARC- это краткий и удобный термин для обозначения процесса маркировки любой
части каталогизационной записи так, чтобы она могла быть обработана с помощью компьютера. В общих словах, коммуникативный формат MARC должен обеспечивать возможность его применения для всех видов библиотечных документов достаточную гибкость для решения разнообразных задач в дополнение к каталогизации удобство применения в различных автоматизированных системах. Применение стандарта MARC в библиотеке, которая до этого работала с каталожными карточками, заметно
увеличит скорость работы, то есть не будет необходимости стоять бог знает сколько времени у каталога, чтобы найти нужную карточку. Стандарт MARC позволяет найти любую книгу, которая имеется в библиотеке, в считанные секунды. Например, если читатель забыл или не знает какого- либо нужного описания книги автор, название и т. п , то MARC дат возможность найти эту книгу по ключевым словам. К достоинствам MARC-а следует отнести и то, что он требует минимум один компьютер, то есть все те каталоги
с карточками становятся ненужными. Использование стандарта MARC предотвращает дублирование работы и помогает библиотекам лучше распорядится библиотечными ресурсами. Выбор для работы формата MARC дат библиотекам возможность приобретать наджные каталогизационные данные, представленные в правильной форме. Применение стандарта MARC при управлении библиотечными операциями позволяет библиотекарям использовать имеющиеся автоматизированные
библиотечные системы. Многие системы, доступные библиотекам разного уровня, спроектированы для работы с форматом MARC. Они технически обслуживаются и совершенствуются, так что библиотеки могут пользоваться преимуществами последних достижений в компьютерной технологии. Стандарт MARC позволяет также библиотекам заменить одну систему на другую с уверенностью, что их данные будут совместимы. Несмотря на сотрудничество стран в этой области появилось несколько версий формата
MARC таких, как UKMARC, INTERMARC, USMARC, расхождения в которых были вызваны различиями в национальных правилах и практике каталогизации. ГЛАВА 1. ОПИСАНИЕ ФОРМАТА USMARC. Библиотека Конгресса является официальным депозитарием публикаций Соединнных Штатов. 1.1 ТЕРМИНЫ USMARC И ИХ ОПРЕДЕЛЕНИЯ. Указатели данных Signposts Чтобы считывать и интерпретировать библиографическую запись, компьютеру
необходима помощь Сравнение одной и той же записи с текстовыми signposts и с метками USMARC иллюстрирует компактность формата USMARC, то есть экономное расходование объма компьютерной памяти. Таблица 1 иллюстрирует запись MARC, размеченную signposts. Наименованиями этих signposts являются ПОЛЕ, МЕТКА, ИНДИКАТОР, ПОДПОЛЕ, КОД ПОДПОЛЯ И ОПРЕДЕЛИТЕЛЬ СОДЕРЖАНИЯ.
Рассмотрим эти термины в отдельности. Поле Каждая библиографическая запись логически делится на поля. Имеется поле для автора, поле для информации о заглавии и т.д. Эти поля подразделяются на одно или несколько подполей. Как было отмечено ранее, текстовые наименования полей слишком длинные, чтобы их приводить в каждой записи USMARC. Вместо этого поля представляются 3-х цифровыми метками.
Метка Каждое поле ассоциируется с трхцифровым числом, которое называется меткой. Метка идентифицирует поле тип данных, которое следует после не. Даже если на экране дисплея сразу после метки выведены ещ и индикаторы таким образом, может появиться число из 4 или 5 цифр, метка всегда представляет собой первые три цифры. См. ниже пример записи поля. Число 100 является меткой, определяющей поле заголовка основной библиографической
записи на имя лица автора. 100 1 a King, StephenВ записи USMARC 10 меток используются достаточно, другие 90 встречаются только в редких случаях. Индикаторы За каждой меткой поля следуют две позиции символов за исключением полей 001- 009. Одна или обе эти позиции символов могут использоваться для индикаторов. В некоторых полях применяется только первая или вторая позиция в других полях используются обе позиции
а в таких полях, как 020 или 300, позиции не используются совсем. Если позиция индикатора не используется, индикатор характеризуется как неопределнный, позиция остатся незаполненной. В данной работе, в примерах, незаполненные или неопределнные позиции индикатора обозначаются символом . Значением каждого индикатора является цифра от 0 до 9. Хотя правилами допускаются буквы, они используются редко.
Даже, если два индикатора вместе могут казаться 2-х значным числом, в действительности они являются двумя отдельными цифрами. В приведнном ниже примере первые 3 цифры являются меткой 245 определяет поле заглавия, 2 следующие цифры 1 и 4 являются значениями индикаторов. 1- первый индикатор 4- второй индикатор. 24514 a The waste lands c adapted from Stephen King.Значение 1 первого индикатора в поле заглавия указывает, что в данном каталоге должна быть
отдельная библиографическая запись на заглавие. В карточном каталоге это означает, что для единицы описания должна распечатываться карточка с добавочной библиографической записью на заглавие, а в справке о добавочных записях должно быть указано Заглавие. С помощью второго индикатора на экране дисплея указывается количество символов в начале поля включая пробелы spaces, которые не должны учитываться компьютером в процессе сортировки и расстановки. Для заглавия The waste lands второй индикатор устанавливается на цифре 4,
чтобы первые четыре символа T, h, e, пробел не учитывались при сортировке и заглавие сортировалось в файле на слово waste. Подполе Большинство полей содержит несколько отдельных взаимосвязанных данных. Каждый тип данных в поле называется подполем, и каждому подполю предшествует код подполя. Поля от 001 до 009 не имеют подполей. Например, поле физического описания для книг определнное меткой 300 включает подполе для объма количество страниц, подполе для других физических характеристик информация
об иллюстрациях, а также подполе для размеров сантиметры 300 a 675 p. b ill. c 24 см.Код подполя Код подполя представляет собой одну букву нижнего регистра в отдельных случаях цифру, которой предшествует разделитель подполя. Каждый код подполя указывает, какой тип данных следует после него. Разделитель Различные программы математического обеспечения для представления разделителя на экране или в распечатке используют различные символы. Примерами могут служить двойной кинжал , знак эт , знак
доллара , линия подчркивания и другие. В данной работе в качестве части кода подполя, являющейся разделителем, используется знак доллара . В приведнном выше примере кодами подполей являются a для обозначения объма, b для других физических характеристик и c для размера. 1.2. КОММУНИКАТИВНЫЙ ФОРМАТ USMARC. Записи USMARC называют теговыми записями записи с метками. Прежде чем стать теговой записью, запись USMARC в так называемом коммуникативном формате
USMARC выглядит совсем по другому как одно длинное слитное предложение. Коммуникативный формат USMARC состоит из маркера и справочника. В коммуникативном формате метки перед полями не проставляются. Однако, непосредственно за маркером следует блок данных, называемых справочником. Этот справочник показывает, какие метки имеются в записи и где они располагаются.
Справочник формируется компьютером из библиографической записи. Маркер Маркер представляет собой первые 24 от 0 до 23 символа записи. Каждая позиция имеет установленное значение. Рассмотрим более подробно значения позиций маркера 00- 04 ДЛИНА ЛОГИЧЕСКОЙ ЗАПИСИ 05 СТАТУС ЗАПИСИ a повышение уровня кодирования c исправленная или пересмотренная d исключнная n новая p повышение уровня кодирования 06
ТИП ЗАПИСИ a языковой материал b контроль за архивными и рукописными материалами c печатное музыкальное издание d рукописный музыкальный материал e печатное картографическое издание f рукописный картографический материал g проекционный материал i немузыкальная звукозапись j музыкальная звукозапись k двухмерная непроекционная графика m компьютерный файл o комплексная работа r трхмерный объект 07 БИБЛИОГРАФИЧЕСКИЙ УРОВЕНЬ a составная часть монографического издания b составная часть сериального издания
c подборка d часть подборки m монография как единица описания s сериальное издание 08- 09 НЕОПРЕДЕЛННЫЕ ПОЗИЦИИ 10 СЧТ ИНДИКАТОРОВ всегда 2 11 СЧТ КОДА ПОДПОЛЯ всегда 2 12- 16 БАЗОВЫЙ АДРЕС ДАННЫХ вычисляется компьютером для каждой записи 17 УРОВЕНЬ КОДИРОВАНИЯ полный уровень 1 полный уровень, анализ материала не проводится 2 менее полный уровень, анализ материала не проводится 5 частичный предварительный уровень 7 минимальный уровень 8 допубликационный
уровень CIP u неизвестно z не применяется 18 ФОРМА ОПИСАТЕЛЬНОЙ КАТАЛОГИЗАЦИИ не соответствует ISBN а AACR2 i ISBN u неизвестно 19 ТРЕБОВАНИЯ К СВЯЗАННОЙ ЗАПИСИ взаимосвязанная запись НЕ требуется для полной обработки составляемой записи r взаимосвязанная запись требуется для полной обработки составляемой записи 20
ДЛИНА КОМПОНЕНТА ДЛИНА ПОЛЯ ДАННЫХ всегда 4 21 ДЛИНА КОМПОНЕНТА ПОЗИЦИЯ НАЧАЛЬНОГО СИМВОЛА всегда 5 22 ДЛИНА КОМПОНЕНТА ЧАСТЬ, ОПРЕДЕЛЯЕМАЯ ПРИ ПРИМЕНЕНИИ всегда 0 23 НЕОПРЕДЕЛННАЯ ПОЗИЦИЯ СИМВОЛА ПЛАНА СПРАВОЧНИКА всегда 0 Справочник Как было сказано ранее, справочник показывает, какие метки имеются в записи и где они располагаются.
Это достигается с помощью подсчта символов в направлении позиции, где начинается каждое поле. Для более наглядного представления рассмотрим пример коммуникативной записи USMARC 00422dam 22001337 00220026619970806174944.800a519.200a519x Ю 16hП 0aЮди н М.Д. 0aСходимость распределений и сумм случайных величин bУчебн.метод.пособие 0aМн.bУниверситетское00a254 c.bил. 00aТеория вероятности, Статистические исследования,
Прикладн ая математика, Случайные величины00b2e2v2t77z0j2 Проанализируем этот пример. Первые 24 позиции являются маркером. Он заканчивается цифрами 4500. Непосредственно после маркера начинается справочник. Метки в этом примере подчркнуты Каждая отдельная статья справочника вместе с меткой имеет длину 12 символов. Первой меткой является 005. Следующие 4 позиции после каждой метки указывают длину поля.
В этой записи данные в поле 005 дата корректировки имеют длину 17 символов. Следующие 5 позиций обозначают начальную точку отсчта позицию начального символа для этого поля в строке данных, которая следует за справочником после первого разделителя . Поле 005 начинается с позиции 0 первая позиция является позицией 0. Следующей является метка поля 008, которое имеет длину 10 символов и начинается с 17-й позиции длина
предшествующего поля 17, добавленная к его начальной позиции 0, равна 17. Следующая метка поля- 090. Оно имеет длину 17 символов и начинается с 27-ой позиции 171027 Последнее поле 990 имеет длину 22 символа и начинается с 266 позиции. Разделители полей в примере они изображены знаком отмечают конец справочника и конец каждого поля, которые следуют за справочником. Разделитель записи изображнный в этом примере знаком заканчивает каждую
библиографическую запись. Приведм, наконец, этот пример в виде размеченного изображения Маркер 00422dam 22001337 4500 DTLT дата и время последней транзакции 005 19970806174944.8 Индекс УДК 080 a 519.2 Шрифты 090 a 519 x Ю 16 h П Имя автора 100 a Юдин М. Д. Заглавие 245 a Сходимость распределений случайных величин b Учебн.метод.пособие Публикация 260 a Мн. b Университетское
Физическое описание 300 a 254 с. b ил. Ключевые слова 653 a Теория вероятности, Статистические исследования, Прикладная математика, Случайные величины Данные о заказе 990 b 2 e 2 v 2 t 77 z 0 j 2 ГЛАВА 2 . ФОРМАТ UNIMARC. 2.1. ЦЕЛИ СОЗДАНИЯ ФОРМАТА UNIMARC. С начала 70-х годов семейство MARC увеличилось более чем на 20 форматов.
Различия в содержании данных этих форматов вызывают необходимость редактирования записи до обмена ими. Для преодоления несовместимости форматов было принято решение разработать международный формат MARC UNIMARC, который позволил бы принимать записи, составленные в любом формате MARC так, чтобы они могли конвертироваться в UNIMARC, а из него в любой другой формат MARC. Для этого каждой национальной службе достаточно будет составить только две программы одну для
конвертирования в UNIMARC, другую из формата UNIMARC вместо специальных программ конвертирования в каждый из форматов MARC, например, INTERMARC в UKMARC, USMARC в UKMARC и т.д. Таким образом, основной целью создания формата UNIMARC является содействие международному обмену данными в машиночитаемой форме между национальными библиографическими службами, а также более простое и удобное составление описания библиографических
единиц, их поиск и контроль. Последнее достигается с помощью разработанных методов записи библиографической информации, осуществляемой в соответствии с международными стандартами. 2.2. ОТЛИЧИЕ ФОРМАТА UNIMARC ОТ ФОРМАТА USMARC. Прежде всего нужно отметить, что те определения, которые приводились для формата USMARC подходят или правильнее сказать применяются в формате UNIMARC то есть понятия поля, метки, индикатора, маркера, справочника и др. сохраняются.
Таким образом, не имеет смысла описывать столь же подробно формат UNIMARC, как был описан формат USMARC. Поэтому стоит остановиться на тех фрагментах, которые отличают эти два формата. Основным отличием форматов UNIMARC и USMARC являются прежде всего несоответствия полей, подполей, индикаторов и т.п. то есть правильнее будет сказать несоответствия меток полей, подполей, индикаторов и т. п
К отличиям можно отнести также и то, что количество полей в формате UNIMARC не совпадает с количеством полей в формате USMARC, причм в UNIMARC полей больше чем в USMARC. Это связано с тем, что сам формат UNIMARC, как было сказано ранее, создавался значительно позже, чем формат USMARC и, соответственно, при создании UNIMARC учитывалось вс, чтобы этот формат был лучшим и
заменил все остальные форматы. Дальнейшие отличия между форматами UNIMARC и USMARC являются более мелкими вытекающими из вышеперечисленных и связаны опять таки с тем, что формат UNIMARC младше формата USMARC например, количество подполей в полях, длины полей, различия в обозначениях индикаторов и другое. Приведм, наконец, пример записи коммуникативного формата UNIMARC и сопоставим его примеру записи коммуникотивного формата
USMARC 00579nam 2200193 3702002600359ru96-37586 a5-88201-040-3 a19970708d1996 u a0rusb0103 ca0 arus1 aInternet Windows95fПитер Кентg Перевод с англ. В. Л. Григорьева aM.cКомпьютерd1996 a367 c.cил.d21 см1 aКомпьютерный мир 21 века0 aВычисл ительные сети глобальные-операционные системы a681.324.0 66100zrus a50drugasnti a32.97drubbk 1aКентbПитер 1aГригорьевbВ. Л. Начнм с того, что первые 24 позиции являются маркером.
Аналогично с записью USMARC, после маркера следует справочник. Метки в справочнике подчркнуты каждая статья справочника занимает 12 символов 4 позиции на длину поля и 5 позиций на точку отсчта. Если внимательно посмотреть, то нетрудно заметить, что метки полей в UNIMARC отличаются от меток в USMARC например, поле автора в UNIMARC-200, а в USMARC-100. Также видно, что повторяется поле 686.
Это говорит о том, что поля в UNIMARC могут повторяться. Больше того, в UNIMARC последовательность приведения полей в записи является свободной ,то есть поля не обязательно должны идти в справочнике в порядке возростания 001, 010, 100, 200 и т.д они могут располагатся свободно 605, 710, 702, 012 и т.д Остальные особенности записи формата UNIMARC приведены в начале пункта 2.2. 2.3. КОНВЕРТИРОВАНИЕ
ДАННЫХ ПО СТРУКТУРЕ USMARCUNIMARC. При создании конверторов USMARCUNIMARC необходимо составить определнные алгоритмы программ. Рассмотрим алгоритм программы-конвертора UNIMARC USMARC. Программа-конвертор может состоять из 3 блоков. В первом блоке программа-конвертор должна считывать те данные из файла, которые необходимо конвертировать.
Второй блок является основным и самым сложным. В нм, собственно, и происходит конвертирование данных. Это конвертирование также можно разделить на несколько состовных частей. Сначала необходимо перестроить маркер. После предстоит конвертирование справочника. Тут будет важным перевести все метки полей, подполей и индикаторов, которые не совпадают. Эту задачу можно решить с помощью дополнительного файла, в котором указаны все метки полей, подполей
и индикаторов одного из форматов. Также нужно учитывать и то, что длины полей формата, который конвертируется могут не совпадать с длинами полей нового формата то есть надо пересчитать эти длины. В третьем блоке новую запись необходимо записать в новый файл, который и будет отображать форму записи нового формата. Алгоритм конвертора USMARCUNIMARC строится аналогичным образом ЗАКЛЮЧЕНИЕ. Итак, мы провели небольшой обзор по форматам автоматизированных библиографических систем
USMARC и UNIMARC так как именно эти два формата имеют наибольшее распространение и доверие в мире. Основная цель данного исследования заключалась не в детальном рассмотрении форматов USMARC и UNIMARC, а в том, чтобы подчеркнуть факт перехода библиотек на эти автоматизированные системы. Хотелось бы подчеркнуть также и то, что более предпочтительней является формат записи UNIMARC, чем USMARC или ещ какой-нибудь. Причины этого назывались ранее.
Можно сказать что формат UNIMARC уже вытесняет формат USMARC, и впоследствии он UNIMARC станет форматом, используемым в большинстве стран мира. Однако наука не стоит на месте, и возможно, уже в скором времени появится более удобный формат.
! |
Как писать рефераты Практические рекомендации по написанию студенческих рефератов. |
! | План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом. |
! | Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач. |
! | Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты. |
! | Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ. |
→ | Виды рефератов Какими бывают рефераты по своему назначению и структуре. |