С развитием информатики наступил новый этап в изучении научных публикаций, поскольку основное внимание стали уделять закономерностям, характеризующим внутреннюю связь изданий с развитием науки, количественные зависимости между числом публикаций и показателями роста науки. Закономерности эти связаны со структурой и свойствами научной информации, но проявляются несколько иначе и могут быть достаточно точно измерены.
Выяснилось, что для числа авторов, публикующих определенное количество работ в течение своей жизни, числа журналов, ежегодно публикующих определенное количество статей, числа публикаций, содержащих определенное количество ссылок на другие публикации, существует общая закономерность распределения. "Они следуют тому же типу распределения, который характеризует соотношение миллионеров и бедняков в условиях высокоразвитой капиталистической экономики: огромная доля богатств находится в руках узкого круга сверхбогачей, а небольшой остаток – в руках несметного множества мелких производителей. Является ли точная форма распределения логарифмической, экспоненциальной, описывается ли она законом Ципфа или обратной квадратной функцией это предмет особого рассмотрения в каждом отдельном случае"[16].
Из предыдущих лет
В последующие годы
Рис. 7. Постоянство авторства (по Д. Прайсу)
Это означает, что большинство авторов за всю жизнь публикует лишь одну или две статьи, тогда как небольшая группа авторов отличается плодовитостью, публикуя по несколько десятков или даже сотен работ. По большей части прекращают выходить в свет периодические издания, успевшие выпустить несколько годовых комплектов, тогда как небольшое число давно выходящих изданий публикует львиную долю всех статей. Примерно половина опубликованной литературы обязана такому числу авторов или журналов, которое составляет квадратный корень общего их количества. "Короче, если, например, в мире выходит 30 тыс. журналов или в какой-либо стране имеется 1 млн научных работников, то лишь небольшое ядро в 175 журналов и 1 тыс. ученых ответственно за половину всей литературы по количеству и, вероятно, за 70–80 % по важности содержания"[17].
Эти положения Д. Прайс иллюстрирует схемой, которую он назвал "подходом страхового агента" к проблеме авторства научных статей, На рис. 7 круг обозначает 100 % авторов в какой-либо области или стране, опубликовавших статьи в определенном году. Левая сторона схемы показывает распределение авторов этих статей по их публикуемости в предыдущие годы (год назад, два-три года назад и ранее не публиковавшихся). Правая сторона показывает то же распределение в последующие годы. Под кругом изображено движение "постоянных" авторов, т. е. публикующихся на протяжении ряда лет (и не учитывавшихся в приведенном выше распределении). Обобщенный смысл этой схемы заключается в том, что для увеличения числа постоянных авторов на одну единицу необходимо появление примерно четырех новых авторов. Один из них заменяет постоянного автора, переставшего публиковать свои труды, два других выбывают по причине "детской смертности". Это те, кто приходят в систему научных публикаций и уходят из нее в течение одного года. И только четвертый остается на более или менее длительный срок печатающимся автором[18].
Рост литературы выражается в непрерывном увеличении числа вновь появляющихся изданий и публикаций. Широко распространенное представление об экспоненциальном росте основных видов литературы справедливо лишь для ее суммарного количества, причем без учета старения. Реальной моделью такого представления могут служить крупные научные библиотеки, комплектующие литературу по широкому профилю и выполняющие функции архивного хранения литературы. Но если нас интересует ежегодный прирост новой литературы, то приходится быть более осторожными в оценках.
Статистика мирового книжного рынка за последние полстолетия показывает, что число ежегодно выпускаемых на рынок книг увеличивается в арифметической прогрессии, а именно, на 15–20 тыс. названий. В 1955 г. по данным ЮНЕСКО опубликовано 269 тыс. названий книг, в 1960 г. – 332 тыс., в 1970 г. –521 тыс., в 1980 г. – 715 тыс., в 1990 г. –842 тыс., в 2000 г.– 1,25 млн. Справедливость требует заметить, что это далеко не все выходящие книги, а только те, которые поступают в продажу. Если бы было возможно учесть заказные, бесплатные, ведомственные, учебно-методические и другие издания ограниченного распространения, то приведенные цифры можно было бы удвоить. Следует также иметь в виду, что научные книги (т. е. содержащие научную информацию в нашем понимании) составляют 20–25 % от общего их числа.
Подсчет числа журналов значительно сложнее, так как они в отличие от книг все время находятся в процессе изменений. Журналы возникают, прекращаются, сливаются, дробятся, меняют название, издателей, периодичность и т. д. По мнению специалистов, только по естественным, точным и прикладным наукам ежедневно три новых журнала возникает, а один перестает выходить.
Наиболее достоверные сведения о числе выходящих журналов можно получить из "Международной библиографии периодических изданий", выходящей под именем Констанции Ульрик. В последнем издании этого справочника зарегистрировано 164400 названий журналов, из которых около 50 % падает на издания по общественным и гуманитарным наукам, 40 % составляют журналы по точным, естественным и прикладным наукам и лишь 10 % – литературно-художественные и общественно-политические журналы. Некоторое представление о темпах роста числа журналов можно получить, сравнивая объемы различных изданий библиографии К. Ульрик: 13-е изд. (1969–70) – 40 тыс. названий, 15-е изд. (1971–72) – 55 тыс., 17-е изд. (1973–74) – 60 тыс., 19-е изд. (1980) – 62 тыс., 21-е изд. (1982) – 63 тыс., 24-е изд. (1988) – 100 тыс., 30-е изд. (1995) – 120 тыс., 39‑е изд. (2001)– 164 тыс.
Старение публикаций заключается в том, что они с увеличением своего "возраста" теряют ценность как источники информации и все меньше используются специалистами. Степень этого использования можно устанавливать при помощи учета цитирования. В данном случае стареет не сама информация, а содержащие ее публикации, поскольку (как мы выяснили) в свежих работах эта информация может быть "упакована" более плотно вместе с новой.
Для измерения скорости старения публикаций американские ученые Р. Бартон и Р. Кеблер предложили в 1960 г. меру, названную "периодом полужизни" публикаций по аналогии с показателем скорости распада радиоактивных веществ. Период полужизни публикаций – это время, в течение которого была опубликована половина всей используемой в настоящее время литературы по какой – либо отрасли или предмету. Например, если этот период ранен 5, то это значит, что 50 % всех процитированных в текущем году по данному предмету работ не старше пяти лет. Ниже приводятся данные разных авторов о периодах полужизни публикаций в различных отраслях науки:
Биомедицина 3,0
Металлургия 4,6
Хим. технология 4,8
Социология 5,0
Машиностроение 5,2
Физиология 7,2
Химия 8,1
Ботаника 10,0
Математика 10,5
Геология 11,8
География 16,0
Достоверность приведенных цифр зависит от величины выборки цитирования, от типа и характера публикаций, поэтому даже в пределах одной науки данные разных авторов могут существенно расходиться. Но дело не только в этом. В 70-е и 80-е годы проблема старения литературы подверглась интенсивным исследованиям, в результате которых ее понимание стало сильно отличаться от концепции "периода полужизни". Начало этому пересмотру положил М. Лайн, который ввел в расчет характеристики старения литературы темпы ее экспоненциального роста. Сущность того, что произошло в трактовке старения, как всегда ярко выразил Д. Прайс: "В течение нескольких лет после публикации спрашиваемость статьи или ее относительная цитируемость уменьшается крайне медленно (по параболе, если считать по логарифмам прошедших лет). Даже через столетие возможность цитирования уменьшается только на порядок. Большинство ссылок падает на работы последних лет потому, что этих работ большинство, и очень сомнительно, чтобы это вызывалось эффектом немедленности, связанным с быстрым старением..."[19].
Этой проблеме до сих пор и у нас и в ряде зарубежных стран посвящается много серьезных работ, которые убеждают в том, что частота использования определенной совокупности литературы одного года издания меняется очень медленно. Использование публикаций, определяемое по их цитированию или на основе запросов читателей, отражает не только старение литературы, но и ее рост.
Для теоретиков информатики и историков науки важно учитывать старение литературы в чистом виде, для информаторов и библиотекарей период полужизни служит важным практическим показателем и продолжает широко использоваться. Следует также иметь в виду, что цитируются далеко не все научные публикации. Половина статей в определенной области в текущем году, как правило, не упоминается, а еще 40 % цитируется лишь один раз (обычно самим автором). Таким образом, активный исследовательский фронт, т. е. число работ, цитируемых более одного раза в году, на порядок меньше корпуса опубликованной литературы.