Археологический источник и база данных. Выбор модели.
Ю.А. Лихтер
По
замечанию И.М. Гарсковой, историки, специалисты по письменным источникам,
знакомство с компьютером начинают, как правило, с создания персональных архивов
машиночитаемых данных[1]. Может быть, поэтому немалое внимание исследователи
уделяют теоретическому осмыслению возникающих при этом проблем. Выделены
основные типы источников - свободные и жестко структурированные (формулярные)[2]
и основные типы подходов - методо-ориентированный и источнико- ориентированный[3
]. Проанализирована совместимость источников различных типов со
стандартными СУБД, создано специальное программное обеспечение - например,
KLEIO и SOCRATES.
Несколько
по-иному обстоит дело в археологии. В первую очередь в компьютер вводится
полевая документация - отчеты и чертежи. Базы данных используются в качестве
вспомогательного средства, преимущественно для ввода полевых описей.
Практикуется также составление списков вещей, используемых при решении какой
либо проблемы - так называемые проблемно-ориентированные базы. При этом
специфика археологических источников не учитывается, виды СУБД подбираются
случайно. Однако проектирование баз данных предполагает знание специфики
материала и осознание поставленных задач[4
].
Учитывая
уже сделанное в исторической информатике для письменных источников, при работе
с археологическими источниками, в первую очередь, необходимо ответить на
следующие вопросы:
Что
собой представляет археологический источник? Какова степень его
структурированности? Какой тип СУБД предпочтительнее? Какой подход выбрать -
источнико- или методо-ориентированный?
Начнем
с определения объекта исследования и характера источника. Объектом исследования
археологии являются древние вещественные источники[5
].
Основными среди них являются культурный слой, сооружения, находки [6
].
Также
как и письменные источники, вещественные источники сами по себе не дают полной
и адекватной картины прошлой действительности; они тоже отражают жизнь
односторонне, избирательно, зачастую неупорядоченно; и они нуждаются в
осмыслении... [7
]. Однако возможности осмысления
ограничиваются тем, что, как следует из самого названия, в источниках этого
рода информация дана в вещественном виде. Чтобы можно было ею пользоваться,
информацию необходимо преобразовать [8
].
Первой
формой преобразования является рисунок, который принято считать наиболее
информативным [9
]. Тем не менее, информация, содержащаяся в
рисунке, всегда ограничена - можно показать форму и, иногда, конструкцию; такие
важные параметры, как техника изготовления и химический состав материала
отразить на них очень сложно. Оперирование рисунками удобно при подборе сходных
вещей, но при этом нет возможности установить критерии сравнения, а
следовательно нельзя перейти к их изучению. Информацию, содержащуюся в вещи,
необходимо перевести из вещественной в словесную форму [10
].
Единственной формой такого преобразования является словесное описание вещи.
Правильно составленное описание дает исследователям возможность получать
сведения о находках из описания, не обращаясь каждый раз к вещи [11
].
В результате описания как бы создается новый источник, являющийся основой для
решения конкретных научных задач.
Описание
может быть образным и аналитическим. Задача образа - дать представление о
предмете, в ходе аналитического описания осуществляется перевод в достаточно
точно определенные логические понятия.
Чтобы
получить представление о предмете, специалисту достаточно его обобщенного
названия, например - "стеклянный кубок типа Ковальк", "фибула -
тип 51 по Петерсену". Для пояснений используется рисунок.
Основой
аналитического описания является набор признаков[12
].
Наиболее широко распространен интуитивный (свободный) отбор, при котором
фиксируются наиболее заметные признаки, причем в пределах одного списка в одних
случаях фиксируется только форма, в других - цвет, материал, наличие или
отсутствие декора. С помощью такого рода описаний довольно просто идентифицировать
находки, но невозможно их сравнивать и изучать. По сути, это такой же не
подвергаемый анализу образ вещи, как и рисунок. Такое описание имеет вид
свободного текста.
В
последние годы были сформулированы принципы описания по системе заранее
заданных признаков [13
]. Наличие заданного набора признаков
сближает такие описания с формулярными письменными источниками. Хотелось бы
отметить и некоторые различия. Как пишет М. Таллер, "...трудновато будет
спросить кого-либо, родившегося в XVI веке о месте его рождения, если он не был
жёстко обязан в свое время вписать эти сведения в соответствующем
документе"[14
]. При работе с вещами мы можем получить
нужные нам сведения после проведения соответствующих анализов:
морфологического, технологического, анализа состава, причем они не обязательно
проводятся одновременно. Полученная при этом информация может быть легко
поставлена на отведенное для нее место без нарушения общей структуры описания.
Следующим
этапом работы с признаками является их оценка[15
]. Здесь
возможны следующие подходы: при одном вес признака оценивается по частоте
встречаемости в конкретной выборке[16
], при другом -
математическому подсчету связей и корреляций признаков предшествует их анализ
на содержательном и логическом уровне [17
]. Логический анализ
признаков позволяет не только выявить набор, но и выстроить иерархию в
сответствии с глубиной описываемого каждым признаком понятия. При этом можно
выбрать соответствующий уровень детализации.
Можно
говорить, что в первом случае сложность объекта рассматривается как
неорганизованная, а во втором - сложность имеет иерархически организованную
структуру[18
].
В
исторической информатике используется две основных модели -
источнико-ориентированная и методо- ориентированная.
Задача
источнико-ориентированной модели - максимально бережное сохранение структуры и
текста первичного источника[19
]. Работа с источником
разделяется - с одной стороны транскрипция источника, с другой - создание
логической системы оценки данных. Именно такая модель реализована в СУБД KLEIO[20
].
Методо-ориентированная
модель предполагает использование строго и точно определенных содержательных
категорий[21
]. Это помогает более четко поставить
исследовательскую задачу и сформулировать требования к данным[22
].
Какой
же из этих подходов предпочтительней при работе с вещественными источниками?
"Буквальный" перевод в машиночитаемую форму, отделение
"буквального" воспроизведения источника в памяти и логической системы
интерпретации данных[23
], для археологического источника
неосуществимы - "перевод с языка вещей на словесный язык" это уже
создание модели. В ходе перекодировки информации создается модель источника,
зависящая от логической системы оценки данных, которая, в свою очередь, напрямую
зависит от оценки материала и принятых автором теоретических установок. Иными
словами, уже на этапе обработки исходного материала археолог имеет дело с
моделью. При проектировании баз данных он, фактически, имеет дело с моделью
модели. В результате в память машины вводится не источник, а его модель,
которая зависит от взглядов исследователя и применяемых им методов. Вследствие
этого для археолога, в отличие от "чистого" историка, работающего с
письменными источниками, предпочтительнее ориентация на метод, а не на
источник.
Таким
образом, выбор между KLEIO и реляционными базами связан не с выбором подхода
(источнико- или методо- ориентированного), а с методами работы с признаками.
Вероятно, при ориентации на образ вещи тип СУБД безразличен. Столь же безразлично
при этом, идет ли речь о полевой описи или проблемно-ориентированном списке
вещей. При статистико-комбинаторном подходе более удобны KLEIO и другие
иерархические СУБД. Они обеспечивают легкость и быстроту поиска различных
признаков, подсчет частоты их встречаемости и корреляций.
Классифицирование
признаков и разделение их по нескольким рубрикам (подсистемам) описания дает
возможность раздробить информацию о вещи на несколько файлов, что позволяет
исследователю при работе иметь в поле зрения именно те подсистемы, которые
необходимы при решении поставленных задач. При такой организации материала
удобнее реляционные СУБД. Существенным свойством реляционных СУБД является
возможность корректировки структуры и при необходимости добавления данных.
В
заключение коротко подведем итоги:
Вещественность
источника предполагает уже на этапе первичной обработки создание его модели.
Возможны как образная, так и аналитическая модели.
Аналитическая
модель имеет вид списка признаков, что сближает ее с формулярными источниками.
Для статистического выделения и оценки признаков более удобны иерархические
базы, при логико-классификационном - реляционные.
При
выборе модели БД сама специфика источника вынуждает применять подход,
ориентированный на метод. Чтобы получить возможность изучать вещи, информацию
нужно перекодировать дважды: перевести с языка вещей на естественный язык и с
него на язык истории как науки [24
]. Эта перекодировка
зависит от теоретических и методических установок исследователя.
Список литературы
1.Гарскова
И.М. Базы и банки данных в исторических исследованиях. М., 1994., с.55.
2.Там
же, с.95.
3.
Там же, с.89.; Таллер М., Что такое
"источнико-ориентированная база данных"; что такое "историческая
информатика"?//История и компьютер: новые технологии в исторических
исследованиях и образовании. Под ред. Л.И.Бородкина и В.Левермана. Goettingen,
1993., с.5.
4.
Гарскова, И.М. Базы и банки данных в исторических исследованиях.
М., 1994., с.55.
5.
Авдусин Д.А. Археология СССР. М., 1977., с. 4-5; Клейн Л.С.
Археологические источники. Л., 1978., с. 38.
6.
Щапова Ю.Л. Естественно-научные методы в археологии. М., 1988.,
с.15.
7.
Клейн Л.С. Археологические источники. Л., 1978., с.21.
8.
Там же, с.45.
9.
Щапова Ю.Л. Естественно-научные методы в археологии. М., 1988.,
с.21.
10.
Клейн Л.С. Археологические источники. Л., 1978., с.47.
11.
Щапова Ю.Л. Естественно-научные методы в археологии. М.,
1988., с.20.
12.
Каменецкий И.С., Маршак Б.И., Шер Я.А. Анализ археологических
источников. М., 1975., с.18.
13.
Щапова Ю.Л. Естественно-научные методы в археологии. М.,
1988., с.31; Щапова Ю.Л. Древнее стекло. Морофология, технология, химический
состав. М., 1989., с.10; Щапова Ю.Л. Лихтер Ю.А., Столярова Е.К. Морфология
древностей. Киев, 1990., с.5.
14.
Таллер М., Что такое "источнико- ориентированная база
данных"; что такое "историческая информатика"?//История и
компьютер: новые технологии в исторических исследованиях и образовании. П/р
Л.И.Бородкина и В.Левермана. Goettingen, 1993., с.11.
15.
Каменецкий И.С., Маршак Б.И., Шер Я.А. Анализ археологических
источников. М., 1975., с.71.
16.
Там же, с.72.
17.
Розова С.С. Классификационная проблема в современной науке.
Новосибирск,1986., с.196.
18.
Блауберг И.В, Садовский В.Н., Юдин Э.Г. Системные исследования
и общая теория систем //Системные исследования. М., 1969., с.13.
19.
Гарскова, И.М. Базы и банки данных в исторических
исследованиях. М., 1994., с.28.
20.
Таллер М., Что такое "источнико- ориентированная база
данных"; что такое "историческая информатика"?//История и
компьютер: новые технологии в исторических исследованиях и образовании. П/р
Л.И.Бородкина и В.Левермана. Goettingen, 1993., с.12.
21.
Таллер М., Что такое "источнико- ориентированная база
данных"; что такое "историческая информатика"?//История и
компьютер: новые технологии в исторических исследованиях и образовании. П/р
Л.И.Бородкина и В.Левермана. Goettingen, 1993., с.5.
22.
Гарскова, И.М. Базы и банки данных в исторических
исследованиях. М., 1994., с.89.
23.
Таллер М., Что такое "источнико- ориентированная база
данных"; что такое "историческая информатика"?//История и
компьютер: новые технологии в исторических исследованиях и образовании. П/р
Л.И.Бородкина и В.Левермана. Goettingen, 1993., с.12-13.
24.
Клейн Л.С. Археологические источники. Л., 1978., с.47.