Р. С. Гиляревский
ОСНОВЫ ИНФОРМАТИКИ
Курс лекций
Лекции рассчитаны на студентов высших учебных заведений. Цель курса лекций – дать студентам представление о современной информатике как научной… В лекциях раскрывается сущность информации и информационной технологии.… Курс "Основы информатики" читался на общеуниверситетской кафедре научной информации Московского…
Содержание
Вводная лекция 6
Информатика как научная дисциплина 6
Становление информатики 8
Предмет и объекты исследования 17
Информатика и другие науки и научные дисциплины 18
Информация – знание – наука 22
Информация и данные 23
Свойства информации 25
Структура информации 26
Особенности информации 27
Информация научная и техническая 29
Наука как социальное явление 33
Перспективы развития науки 42
Интеллектуальная коммуникация 46
Основные понятия 46
Система научной коммуникации 47
Библиотечная и информационная деятельность 53
Научно-информационная деятельность 57
Этапы и задачи коммуникации 58
Информационное обслуживание 61
Перспективы развития 63
Человек в процессе коммуникации 64
Потребители информации 64
Эгалитарность информационного обслуживания 68
Информационные потребности в развитии 74
Литература как источник информации 78
Основные понятия, эволюция и типология 78
Закономерности роста и старения 84
Закон рассеяния 89
Перспективы развития 93
Информационные издания и услуги 96
Основные виды 96
Реферирование и библиографирование 97
Реферативный журнал ВИНИТИ 104
Зарубежные реферативные журналы 106
Электронная информация и базы данных 113
Сети передачи и средства хранения и обработки данных 116
Информационные услуги 117
Информационные структуры и инфраструктура 120
Информационный поиск 127
Предыстория и сущность 127
Процедуры и понятия 130
Координатное индексирование 134
Цитирование, библиографическое сочетание, социтирование 137
Иерархические и фасетные классификации 141
Рубрикаторы информационных изданий 148
Разные типы информационно-поисковых языков 150
Базы и банки данных 153
Информационные системы 157
Информационно-поисковые системы 157
Интеллектуальные информационные системы 158
Гипертекстовые системы 160
Системы машинного перевода 170
Информационная технология 175
О понятии информационной технологии 175
Тенденции развития информационных технологий 178
Влияние информационных технологий на развитие науки 181
Социальные последствия новой технологии 184
Компьютерные средства коммуникации 188
Электронные вычислительные машины 188
Новые поколения компьютеров 191
Персональный компьютер и персональные вычисления 195
Работа с текстом на компьютере 202
О языках программирования 202
Прикладные программы подготовки текстов 207
"Понимание" текста на естественном языке 216
Электронная книга 225
Новая концепция книги 225
Сущность, особенности и разновидности электронной книги 227
Электронный журнал: проблемы распространения и хранения 228
Организационные и юридические проблемы 233
Электронная библиотека реальная и виртуальная 235
Лучше ли электронная книга традиционной печатной? 239
Сведения об Интернет 248
Интернет как глобальная компьютерная сеть 248
Организация доступа к первоисточникам 254
Заключительная лекция 267
Идеи и методы информатики 267
Поиски фундаментального закона 271
Определение и предметная область информатики 276
Перспективы информатики 280
Словарь терминов 284
Вводная лекция
Информатика как научная дисциплина
В последние десятилетия в информационной технологии, т. е. методах и технических средствах передачи информации, произошла компьютерная, а вернее… Новая информационная технология – компьютерная подготовка текстов,… Студенты, пришедшие в вуз из средней школы, убеждены, что информатика сводится к процессу овладения этими навыками, а…
Становление информатики
Представляют интерес высказывания некоторых американских ученых, которые с разных позиций оценивали развитие информатики. Проф. Т. Сарацевич… На протяжении 50-х и 60-х годов информатика исходила из общественной… Таблица 1
Предмет и объекты исследования
Определение «семантическая», которым мы уточняем содержание понятия «информация», необходимо, поскольку в русском языке информация трактуется весьма… Данные – это представление фактов и понятий в форме, пригодной для их… Объектами исследований информатики служат методы и средства, используемые для сбора, переработки, хранения, поиска и…
Информатика и другие науки и научные дисциплины
В свое время острый полемический интерес представляли взаимосвязи информатики с дисциплинами коммуникативного цикла, в первую очередь, с… При рассмотрении взаимосвязей между информатикой, программированием и… Каждый из этих компонентов требует участия людей, обладающих специальными знаниями и навыками. Задачу обычно ставит и…
Информация – знание – наука
В последние годы в информатике обсуждается возможность разных подходов к понятию информации, которая может трактоваться как управляющий сигнал в…
Информация и данные
В повседневной жизни информация означает сообщение, осведомление о положении дел, сведения о чем-то. Для философов, склонных рассматривать… Для специалистов в области информатики, изучающей структуру и общие свойства и… Данные суть факты, идеи, сведения, представленные в знаковой (символьной) форме, позволяющей производить их передачу,…
Свойства информации
Собственные свойства информации:
– неаддитивность: прибавление информации к уже имеющейся не увеличивает ее… – некоммутативность (неперестановочность): суммарное количество полученной информации зависит от последовательности…
Структура информации
Поскольку отчуждение информации от ее создателей происходит не непрерывно, а дискретно, в виде относительно законченных творческих актов, получающих… С дискретностью семантической информации тесно связана и ее структура, которая… Формальная структура данных / семантической информации так же иерархична, как и содержательная. Низшие уровни этой…
Особенности информации
Часто информацию, которая играет все более важную экономическую роль, называют товаром (commodity), наивно полагая, что товаром является любой… Информация – категория нематериальная, и продается не она сама, а право на ее… Однако на любое научное открытие или изобретение из-за его уникальности (неповторяемости) требуется затратить именно…
Информация научная и техническая
Из сказанного следует, что обеспечение сбора, обработки, хранения, поиска, распространения и использования возрастающих объемов цифровой информации,… Кроме того, возрастанию потоков информации в большой степени способствует… Под научной информацией мы понимаем любую достоверную информацию, относящуюся к любой области естественных,…
Наука как социальное явление
В изучении социологических тенденций развития науки в последние десятилетия наблюдается значительный прогресс. Большинство отечественных и… Первая из них, называемая им "инструментальной", характерна для… Надо сказать, что эти концепции в какой-то мере соответствуют нашим представлениям о прикладной и фундаментальной…
Перспективы развития науки
Действительно, научное сообщество, его "незримые коллективы" стремятся сохранить выработанные в течение трех столетий нормы поведения… Однако внешние аспекты современной модели науки во многом не соответствуют… Прежние тенденции, восходящие к "малой науке" университетского типа, ведут к неконтролируемому росту числа…
Интеллектуальная коммуникация
Основные понятия
Интеллектуальной коммуникацией называют обмен информацией между индивидами посредством общей для них знаковой системы при помощи жестов, устной речи, письменности и т. п. Различают сферы массовой коммуникации (основными средствами которой являются печать, радио, телевидение) и научной коммуникации.
Под научной коммуникацией мы понимаем совокупность процессов представления, передачи и получения научной информации, образующих основной механизм существования и развития науки. Во всех процессах научной коммуникации участвуют ученые и специалисты. Степень их участия различна в зависимости от каналов коммуникации, которые делят на формальные и неформальные.
К неформальным относят непосредственный диалог между учеными и специалистами о проводимых ими исследованиях и разработках, посещение лабораторий коллег и научно-технических выставок, выступления перед аудиторией, обмен письмами и препринтами.
К формальным каналам относят процессы обмена научной информацией посредством литературы. В них непосредственное участие ученых и специалистов, создавших научную информацию, значительно меньше, так как эти процессы оформились в самостоятельные виды деятельности: научно-информационную, библиотечно‑библиографическую, архивную, редакционно‑издательскую, журналистскую.
Следует отметить, что лишь первый канал специфичен для научной коммуникации, а остальные выполняют роль общих информационных каналов для всех видов семантической информации. В этом направлении развивается и научно-информационная деятельность, методы и средства которой все шире используются во всей сфере информационной коммуникации.
В связи с быстрым развитием технических средств коммуникации на Западе существуют различные теории, определяющие роль этих средств и самой информационной коммуникации. Среди них особого внимания заслуживает "маклюэнизм", философская концепция средств общения, сформулированная в 60-е годы канадцем Маршаллом Маклюэном. Три его последовательно выпущенные книги, ("Исследования в области средств коммуникации", "Гутенбергова галактика" и "Средства понимания: расширение возможностей человека") вызывали бурные дискуссии среди философов и социологов, Его называли "оракулом электронного века" и сравнивали с Ньютоном, Дарвиным и Фрейдом.
Отвлекаясь от этих эмоциональных оценок, нельзя не признать, что М. Маклюэн первым предпринял серьезную попытку исследовать роль новейших средств коммуникации в человеческом обществе и выявить их свойства и закономерности развития. Ему удалось сделать глубокие и верные наблюдения относительно природы, значения и сферы использования таких средств массовой коммуникации, как кино, радио, телевидение, печать, звукозапись, телефонная и телеграфная связь и т. п.
Широко трактует М. Маклюэн значение книгопечатания для последующего развития человеческого общества. Он считает, что с книгой в общественную жизнь внедрились принципы непрерывности, единообразия и повторности, которые стали основой вычислений и торговли, промышленного производства, искусства и науки.
Основная его идея заключается в том, что средства коммуникации являются определяющим фактором в развитии человеческого общества, а общественная жизнь в большей мере зависит от характера и свойств средств передачи информации, чем от содержания передаваемых сообщений. Крайность таких утверждений неоднократно подвергалась справедливой критике. Однако маклюэнизм заслуживает внимания как одна из немногих попыток создания всеобщей теории коммуникации.
Система научной коммуникации
Определяя свойства системы научной коммуникации в духе требований общей теории систем, следует констатировать, что она является открытой системой,… Система научной коммуникации отличается устойчивостью по отношению к внешним… Среди названных подсистем наибольшее значение для рассматриваемых дисциплин имеет подсистема научной литературы,…
Библиотечная и информационная деятельность
Основную массу научных документов составляют публикации. Каналы их распространения занимают центральную часть схемы. Создатели этих документов,… … Эти учреждения призваны выявлять и собирать научную информацию, анализировать и перерабатывать ее в формы, удобные для…
Научно-информационная деятельность
Научно-информационная деятельность – это организационно оформленная разновидность научного труда, который выполняется в целях повышения собственно… Для уяснения этого определения важно отметить, что под аналитико-синтетической… Другая точка зрения, высказываемая некоторыми информатиками, инженерами и менеджерами, заключается в том, что,…
Этапы и задачи коммуникации
Рис. 6. Этапы (функции, задачи) коммуникации
… Затем необходимо выполнить аналитико-синтетическую переработку информации.… Результаты этого анализа записываются кратко: они синтезируются в специально разработанных для этого условных…
Информационное обслуживание
* от кого исходит инициатива при обслуживании – от информационной службы или от потребителя,
* как осуществляется обслуживание – посредством опубликованных или… * на кого направлено обслуживание – на единичного или массового потребителя,
Перспективы развития
Второе соображение связано с перспективами информационных профессий. Новая информационная технология, дающая ученым и специалистам возможность,…
Человек в процессе коммуникации
Потребители информации
Мы уже говорили о том, что "потребление" информации в корне отличается от потребления товаров материального характера. И хотя результаты… Информация, как вы уже поняли, сама по себе не является товаром и,… Тем не менее, термин "потребитель информации" укоренился в информатике, широко используется и дал много…
Эгалитарность информационного обслуживания
Здесь действует общий для всех информационных процессов логарифмический закон, по которому лишь незначительная часть потребителей информации… Мы уже отмечали, потребители информации не являются однородной массой… Информационная служба достаточно дорога, и по мере усложнения услуг и внедрения в информационные системы современной…
Информационные потребности в развитии
а) при текущем ознакомлении с новыми сведениями, как по их узкой специальности, так и в смежных областях,
б) при повседневной работе, когда необходимо получить конкретные фактические… в) в начале работы над новой проблемой или темой и при ее завершении и литературном оформлении, когда необходимо путем…
Литература как источник информации
Основные понятия, эволюция и типология
Строго говоря, источником любой информации является человек или группа людей. Ответственность за достоверность тех или иных сведений могут брать на себя учреждения или организации, которые в этом случае также служат как бы источниками информации. Но в профессиональной информационной деятельности информация циркулирует в виде документов, и именно они считаются источниками информации.
Под документом понимается совокупность логически завершенных сведений и материального носителя, на котором они записаны, с непременным указанием кем, где и когда документ был создан. Понятие документа является альтернативным и обобщающим по отношению к понятию произведения письменности и печати, часто употребляемому в гуманитарных науках.
Произведением письменности считается результат целенаправленной познавательной деятельности (факты, идеи, образы), имеющий определенную логическую взаимосвязь частей, завершенность в целом и изложенный в письменном виде. Произведение печати, кроме того, получает обязательную редакционную апробацию и имеет точный библиографический адрес, состоящий из стандартного набора выходных сведений (автор, заглавие, город, издательство и год публикации или название публикующего органа).
Поскольку способы хранения и передачи информации играют большую роль в развитии коммуникации, да и цивилизации в целом, интересно проследить эволюцию этих способов.
С развитием каждой цивилизации по мере усовершенствования ее языка и письменности вырабатывались и определенные типы документов, как по форме, так и по содержанию. Самые древние из дошедших до нас документов – клинописные плитки Месопотамии – датируются четвертым тысячелетием до н. э. От шумерской культуры того времени и вавилоно-ассирийской, расцвет которой приходится на второе тысячелетие до н. э., сохранились сочинения в области астрономии, географии, истории, права, торговли. Наряду с небольшими глиняными плитками высотой в 2,5 см изготовлялись плитки высотой до 40 см, содержащие до 400 строк в 4 колонки с двух сторон. Основным недостатком этих глиняных книг, в течение тысячелетий обслуживавших культурные и научные потребности человека, была их громоздкость и недостаточная емкость. Отдельные произведения занимали до 10 плиток. Собрания, насчитывавшие десятки тысяч плиток (а до нас дошли остатки подобных библиотек), требовали огромных помещений.
Папирусный свиток – более компактная форма документа, позволявшая накапливать большие собрания произведений письменности. Начиная с третьего тысячелетия до н. э. в Египте изготовлялись именно такие книги. Текст на папирусном свитке располагался перпендикулярно его длине колонками от 25 до 45 строк. Хрупкость и недолговечность папируса обусловила незначительное число дошедших до нас образцов древнеегипетских документов (древнейший из них восходит к XVIII в. до н. э.). Это, главным образом, ритуальные "книги мертвых", извлекаемые археологами из пирамид и других захоронений.
У греков и римлян на протяжении долгого времени сведения (особенно научного характера) распространялись устным путем. Известно, что лишь после Аристотеля для этих целей стали широко применяться рукописи. До середины нашего века мы не располагали ни одним оригиналом времен античных классиков, часто столетия отделяют последнюю сохранившуюся копию от возможной даты написания текста. Исключение составляет лишь найденные во время второй мировой войны кумранские рукописи ("рукописи Мертвого моря"), датируемые первым веком н. э. Сведения о греческих и римских папирусах почерпнуты из малоазиатских и позднеегипетских образцов. Средняя длина свитка не превышала 10 м, ширина – 30 см.
Пергамент, изготовлявшийся из телячьих шкур, известен как материал для письма с III в. до н. э. Он позволял писать с двух сторон, был более долговечен, чем папирус, и обусловил переход к современной блочной форме книги – кодексу. Кодексы из папируса изготовлялись еще в первые века н. э., но к V в. были вытеснены пергаментным кодексом.
Кодекс – более емкая форма книги, чем свиток, он удобнее для записи больших текстов и для наведения справок, Пергаментные кодексы вплоть до XII в. были единственной формой книги в Европе. Основным их недостатком, препятствовавшим широкому распространению письменных документов, была дороговизна. Для одного экземпляра пергаментной книги требовались шкуры целого стада. На смену пергаменту пришла бумага, изобретенная в 105 г. в Китае. На Ближнем Востоке ее начали изготовлять с 751 г., а в XII в. через арабских завоевателей Испании она проникла в Европу.
Бумажная книга, значительно более дешевая, чем пергаментная, стала широко использоваться в научных и образовательных целях. Опыт нескольких тысячелетий развития письменных документов показывает, что их форма менялась главным образом под влиянием потребностей общества: документы становились все более емкими, удобными для использования и дешевыми. Именно эта тенденция развития средств, служивших для закрепления информации, привела к появлению бумажного книжного блока, который до нашего времени оставался основной материальной формой документа.
В XV в. стала повсеместно ощущаться потребность в новом способе изготовления документов. Рукописная книга перестала удовлетворять культурные и научные запросы общества по двум причинам. Во-первых, она изготовлялась слишком долго и требовала значительных затрат труда. Во-вторых, переписка текстов от руки не давала возможности получить большое число экземпляров идентичного содержания, так как копии одного и того же текста отличались друг от друга из-за искажений, вносимых переписчиками.
Именно к этому времени относится историческое изобретение в 1448 г. немецким ремесленником И. Гутенбергом книгопечатания подвижными литерами. Технические средства, которые легли в основу книгопечатания, – граверная и литейная техника и винодельческий пресс, преобразованный Гутенбергом в печатный станок, – были известны еще в античные времена. Однако лишь настоятельная потребность общества в быстром и точном механическом воспроизведении текстов вызвала к жизни это изобретение, совершенству которого мы не перестаем удивляться и основными принципами которого продолжаем пользоваться для размножения документов.
Мы знаем, что теперь появились технические средства, значительно повысившие наши возможности хранения больших массивов информации с быстрым доступом к любой единице этой информации. Речь идет о компактных оптических дисках, используемых в качестве внешней памяти компьютера (CD-ROM – Compact Disc Read Only Memory). В этой области прогресс происходит так быстро, что рискованно приводить какие-либо точные данные. Но объем одного диска измеряется тысячами мегабайт, т. е. миллионами страниц текста, время записи и считывания одной страницы не превышает 1–2 сек., а в "библиотеке" из 64 дисков поиск и выдача информации по запросу занимает 10–15 сек. Выведенные на экран тексты и изображения можно изменять по мере необходимости. Эти новые средства начинают широко использоваться , и мы еще будем о них говорить.
В широком смысле документами иногда считают не только надписи, рукописи и печатные издания, но и произведения искусства, нумизматические памятники, музейные экспонаты минерального, ботанического, зоологического или антропологического характера. П. Отле считал документом любой материальный объект, который фиксирует или подтверждает какие-либо знания и может быть включен в определенное собрание.
Различные виды научных документов возникали в разное время и на протяжении последних столетий и даже десятилетий претерпевают значительную эволюцию. Книга существует уже несколько тысячелетий, описание изобретений – 500 лет, научный журнал – немногим менее 350 лет, а журнальная статья в ее настоящем виде – 100–150 лет. Типология документов также существенно меняется. До последнего времени наиболее важным считалось деление научных документов на опубликованные и непубликуемые. Еще несколько десятилетий назад идеи и факты признавались введенными в оборот только после их опубликования, означавшего широкое распространение и официальную регистрацию документов, в которых они содержались.
Для информационной деятельности это разграничение менее существенно, так как, во-первых, в неопубликованных документах содержится много ценной информации, опережающей сведения, появляющиеся в публикациях, а, во-вторых, новые средства репродуцирования делают это разграничение очень условным. Такие научные документы, считающиеся обычно непубликуемыми, как отчеты, диссертации, переводы, часто распространяются в сотнях и даже тысячах экземпляров.
Информатика выдвинула на первый план деление документов на первичные и вторичные. Деление это также очень условно и приблизительно, поскольку оно главным образом относится к самой информации, а не к документам, в которых она содержится. Считается, что в первичных документах отражаются непосредственные результаты познания, а во вторичных – результаты аналитико-синтетической переработки информации, содержащейся в первичных документах. Однако исторически сложившаяся система научных документов такова, что многие из них содержат одновременно и результаты научных исследований и переработку прежних сведений, содержавшихся в ранее опубликованных документах. Примером могут служить и статьи в научных журналах, и монографии, и учебники, и особенно – справочная литература.
Тем не менее, деление это удобно, так как позволяет характеризовать различные потоки документов в информационной деятельности. Мы придерживаемся его в информатике, считая первичными те документы и издания, в которых преимущественно содержатся новые сведения или новое осмысление известных идей и фактов, а вторичными те документы и издания, в которых содержатся сведения о первичных документах. С учетом сделанных оговорок к первичным документам и изданиям можно отнести большинство книг (за исключением справочников), журналы, газеты и сериальные издания, описания изобретений, стандарты, отчеты, диссертации, переводы, а ко вторичным – справочники и энциклопедии, обзоры, реферативные журналы, библиотечные каталоги, библиографические указатели и картотеки.
Основные виды первичных документов и изданий охарактеризованы в книговедческих курсах, а вторичным будет посвящена в данном курсе лекция об информационных изданиях и услугах. Здесь хотелось бы высказать некоторые соображения лишь о журналах, так как на их примере дальше будут анализироваться закономерности роста, старения и распределения научных публикаций. Журналом мы будем называть периодическое (сериальное) издание, регулярно публикуемое в течение одного года выпусками, одинаково оформленными и содержащими статьи или иные материалы научно-технического или общественно-политического содержания, а также произведения художественной литературы. В журналах содержится новейшая информация, освещаются последние достижения науки и техники. Журналы появились почти триста пятьдесят лет назад: точной датой этого события считается 5 января 1665 г., когда был опубликован первый номер французского еженедельника "Журнал ученых", который дал название этому виду периодических изданий.
Основным назначением этого журнала, предопределившим характер научных журналов на 150 лет вперед, стало оповещение о новых книгах по всем отраслям науки, литературы и искусства, однако с особым вниманием к естественным наукам и технике. Для раскрытия содержания книг в то время широко пользовались прямыми заимствованиями и цитатами из текста. Вначале научная хроника играла в журнале второстепенную роль, постепенно все больше места в нем стали занимать сообщения об экспериментах в области естественных наук и вновь открытых явлениях природы. Оригинальные статьи в течение всего XVIII в. публиковались в журналах редко. Обычно они принадлежали крупным ученым и имели традиционно-условную форму писем одного ученого к другому: так было принято сообщать о научных открытиях в предшествующие эпохи.
Начиная с XIX в. журнал становится основным источником научной информации. В нашем столетии установилась исключительно важная практика упоминания в каждой журнальной статье всех научных работ, которые использовались при ее написании. Статьи в научных журналах являются в настоящее время основным источником научной информации, они прочно занимают первое место среди всех других документов. Обследование библиографических запросов нескольких тысяч ученых и инженеров показало, что до 70 % всех используемых ими источников составляют журнальные статьи.
Однако рост числа журналов, их недостаточная профилированность, быстрое старение опубликованных в них материалов привели к тому, что уже с 30-х годов журнал как источник информации стал подвергаться критике ученых. Они выдвинули множество проектов замены научных журналов другими средствами распространения знаний. В их основе лежит предложение вместо издания журналов депонировать разрозненные статьи в специальных отраслевых центрах и отражать их в реферативных журналах.
Один из первых проектов такого рода был выдвинут отечественными учеными, делегатами Международного геологического конгресса в 1933 г. В этом же году англичанин У. Дэвис сделал аналогичное предложение, которое легло в основу известного "плана Бернала", опубликованного в 1939 г. в книге Дж. Бернала "Социальная функция науки". Этот план был предметом обсуждения в 1948 г. на Конференции по научной информации, созванной английским Королевским обществом, а в 1958 г. на Международной конференции по научной информации в Вашингтоне. Дж. Бернал предложил отказаться и от самой статьи как формы сообщения результатов научного исследования, поскольку она не обеспечивает их быстрого и адекватного отражения. Рациональные моменты в этих его идеях были воплощены при создании системы депонирования неопубликованных научно-технических документов. Однако полностью план Бернала вряд ли когда-либо будет реализован, так как он не учитывает многих закономерностей системы научных публикаций.
Закономерности роста и старения
Выяснилось, что для числа авторов, публикующих определенное количество работ в течение своей жизни, числа журналов, ежегодно публикующих…
Из предыдущих лет
…
Закон рассеяния
В соответствии с этим законом журналы по продуктивности можно сгруппировать так, чтобы они как бы образовали три зоны. Включенные в каждую такую… Т1 : Т2 : ТЗ = 1 : a : a2,
где а является коэффициентом рассеяния, т. е. величиной для данного предмета и времени постоянной.
Перспективы развития
Но это вовсе не означает, что журнальные публикации вообще утрачивают свое значение. По мнению Д. Прайса, "80 % ценности и функционального… Мы уже говорили раньше о том, что наряду с источниками информации в… Увеличение темпов роста первичной и вторичной информации он оценивал в 12–13 % в год. При этом он считал, что от 1/4…
Информационные издания и услуги
Основные виды
* библиографические указатели (БУ), бюллетени сигнальной информации (СИ), в которых приводятся в систематизированном виде библиографические данные… * реферативные журналы (РЖ), в которых приводятся в систематизированном виде… * продолжающиеся обзорно-аналитические издания по избранным отраслям, предметам и проблемам (типа «Advances in…»,…
Реферирование и библиографирование
Даже самый беглый взгляд на историю реферирования, которая уходит корнями в глубокую древность, показывает, что этот вид информационной деятельности… Однако грандиозный и все возрастающий объем реферирования, исчисляемый… При использовании реферата как средства текущего оповещения он составляется в расчете на узкий круг специалистов,…
Реферативный журнал ВИНИТИ
Потребовалось почти десять лет, чтобы этот журнал сложился как ведущий многоотраслевой реферативный журнал мира. В настоящее время он отражает около… Все опубликованные материалы обязательно проходят научную экспертизу (путем их… При этом следует помнить, что если какая-либо публикация не будет отражена в РЖ или другом информационном издании, то…
Зарубежные реферативные журналы
Applied Mechanics Reviews (AMR) – ежемесячный РЖ по техническим наукам, издается Американским обществом инженеров-механиков с 1948 г., публикует… Astronomy and Astrophysics Abstracts (AAA) – РЖ по астрономии, астрофизике и… Biological Abstracts (BA) – РЖ по биологическим наукам, издается информационной службой BIOSIS (BioSciences…
Электронная информация и базы данных
Составной частью системы информационных изданий является служба быстрого изготовления и доставки читателям (потребителям информации) копий… Большое значение в научно-информационной практике имеют указатели цитирования… Внедрение средств вычислительной техники в сферу подготовки печатных изданий привело к появлению электронных аналогов…
Сети передачи и средства хранения и обработки данных
Для теледоступа к БД, находящимся в специальных службах поиска информации, кроме персонального компьютера необходимы соответствующие каналы и сети… В США завершается создание еще более мощной Национальной сети для исследований… Создание быстродействующих цифровых сетей передачи данных позволило разработать и внедрить видеографические системы…
Информационные услуги
– специальная информация,
– электронные сделки,
– электронная коммуникация.
Информационные структуры и инфраструктура
Наиболее упорядоченными информационными структурами являются системы научно-технической информации, существующие фактически в любой стране.… В настоящее время, когда информация все больше становится экономическим… В странах, ставших политически независимыми после второй мировой войны и/или не имевших исторически сложившихся…
Информационный поиск
Предыстория и сущность
Эти соображения, уже высказанные в лекции об информационной деятельности, уместно повторить, начиная разговор об информационном поиске, поскольку он… Само понятие информационного поиска появилось только в середине нашего века.… В основе этого понятия лежит представление о том, что поиск необходимой информации в любом собрании документов…
Процедуры и понятия
К этому времени стало ясно, что информационный поиск – это совокупность логических процедур, в результате которых в ответ на информационный запрос… Каждый вновь появляющийся документ подвергается анализу, в результате которого… Индекс образуется путем мысленного сопоставления основного смыслового содержания с потенциальными запросами…
Координатное индексирование
Преимущества данного метода очевидны. Прежде всего, информационные работники и потребители информации освобождаются от жестких рамок… При поиске необходимой информации специалист может формулировать свой запрос в… Основные достоинства этого принципиально нового подхода к раскрытию содержания документов и поиску информации…
Цитирование, библиографическое сочетание, социтирование
Указатели цитированной литературы позволяют искать информацию по совершенно новым межотраслевым или комплексным проблемам под фамилиями пионеров и… Индексы цитирования предоставляют уникальную возможность проследить за всеми… В двух статьях E и F, например, (см. рис. 10) имеются библиографические ссылки, которые устанавливают прямую…
A C
E E
B F
E D
F F
Библиографическое
сочетание Социтирование
Цитируемые документы
Рис. 10. Схема цитирования, социтирования и библиографического сочетания документов
Понимание потенциальных возможностей комплексирования документов по признаку общих ссылок и стремление максимально использовать накопленный массив в машиночитаемой форме повели к поискам новых путей применения метода цитирования. Еще в 1963 г. М. Кесслер в Массачусетском технологическом институте предложил считать связанными по смыслу документы, авторы которых ссылаются на одни и те же работы, а числом совпадающих ссылок измерять степень такой связанности. Этот метод, который он назвал библиографическим сочетанием документов, долгое время не имел широкого практического применения, но в 1968 г. Ю. Гарфилд использовал его для создания ретроспективной поисковой системы на компакт‑дисках.
По-другому подошли к этой проблеме сотрудник Института научной информации США Г. Смолл и тогдашняя аспирантка ВИНИТИ И. В. Маршакова. Они одновременно и независимо друг от друга в 1972 г. предложили считать связанными по смыслу и тематике работы, на которые совместно ссылаются авторы нескольких документов. Этот метод, чаще всего называемый социтированием, имеет другую коммуникационную основу. В каждой исследовательской области имеется некоторый набор важных работ, отражающих познавательную основу этой области. Данные работы цитируются многими исследователями и поэтому принадлежат к числу высоко цитируемых. Больше того, они часто цитируются вместе, образуя таким образом социтирование. Другими словами, социтированием принято называть одновременное упоминание любых двух или большего числа публикаций в какой-либо последующей.
Для лучшего представления разницы в этих методах выше приведена схема, на которой E и F являются цитирующими документами текущего года, а A, B, C и D – цитируемыми документами более ранних годов. Сплошными стрелками показаны связи по цитированию, т. е. E цитирует A, B и C, а F цитирует B, C и D . Тогда между цитирующими работами E и F образуется библиографическое сочетание, а между цитируемыми работами B и C – социтирование (обозначено пунктиром). Для простоты и наглядности степень связанности на схеме минимальная, хотя на практике она значительно больше (т. е. для признания библиографического сочетания между двумя работами или кластера социтирования в каждом отдельном случае устанавливается определенный минимальный порог, который тем выше, чем интенсивнее цитирование).
Между характером этих методов установления связи и областью их применения имеется существенная разница. Библиографическое сочетание – это однократно произошедший факт, поскольку E и F были однажды опубликованы со своими ссылками, и с ними в дальнейшем ничего уже произойти не может. Именно поэтому данный метод применяется для ретроспективного поиска документов, связанных между собой единством тематики, исследовавшейся их авторами.
Совсем по-другому обстоит дело с социтированием, так как связь между цитируемыми B и C может сохраняться (увеличиваться или уменьшаться) в последующие годы в зависимости от того, насколько часто они будут попарно цитироваться в новых работах. Частое социтирование указывает на их концептуальную близость, поскольку они используются как единый комплекс. Между этими работами как бы возникают невидимые связи, которые после наглядного их выражения образуют смысловые сгустки (кластеры). Совокупность таких кластеров ключевых работ, отражающих исследовательские области, представляют собой как бы карту определенной научной области, а совокупность карт – атлас науки на данный момент.
При регулярном выпуске подобных атласов (выходили атласы по биологии, биохимии, геологии, математике, вычислительной технике) появляется возможность регулярно следить за динамикой развития научных дисциплин, школ, направлений, коллективов, а, следовательно, и целенаправленно воздействовать на это развитие, т. е. управлять им. Методы библиографического сочетания и кластеризации социтирования моделируют содержательные отношения между документами, используя практику цитирования, сложившуюся при публикации научных работ. Но это не единственный возможный подход к установлению таких связей между документами, заложенных в их библиографических элементах и фрагментах текстов. В следующей лекции об информационных системах вы познакомитесь с методом логико-смыслового моделирования, а теперь мы перейдем к более традиционным видам информационно-поисковых языков.
Иерархические и фасетные классификации
Было бы неверно думать, что будущее только за цитированием, за информационно-поисковыми языками координатного индексирования, которые вытеснят традиционные языки. В этом случае, как и во всей системе коммуникации, действует закон развития, по которому новые средства не заменяют полностью прежних, а лишь перераспределяют функции между ними. Это в полной мере относится и к такому древнему средству информационной технологии, как иерархические классификации, наиболее распространенной представительницей которых выступает Универсальная десятичная классификация (УДК). Создание УДК явилось переломным моментом в развитии ИПЯ: она завершила тысячелетнюю историю линейных классификаций перечислительного типа и открыла пути к построению фасетных классификаций.
Библиотечные классификации – самый ранний из известных нам типов ИПЯ. Если проследить за их развитием от классификации вавилонских библиотек вплоть до библиотечных классификаций второй половины XIX в., становится ясно, что принципы их построения почти не изменялись. Следуя за наиболее известными системами классификации наук, библиотечные классификации строились на основе иерархического "древа знаний" с выделением специальных разделов и подразделов для систематизации особых видов книг. До нас дошло очень немного сведений о классификациях, применявшихся в древних библиотеках. Вероятно, в античные времена такие классификации были разработаны достаточно детально. Об этом можно судить по обширности библиотек, высокому уровню классификации наук того времени, а также по некоторым косвенным свидетельствам, содержащимся в литературных памятниках.
На классификации средневековья известное влияние оказала распространенная в то время система "семи свободных искусств". Она состояла из двух комплексов наук, изучавшихся в тогдашней школе: "тривиума" (грамматики, диалектики и риторики) и "квадривиума" (арифметики, геометрии, музыки и астрономии). К концу XV в. в университетских библиотеках начали применять группировку книг по содержанию в соответствии с существовавшими в большинстве университетов четырьмя факультетами: философским, медицинским, юридическим и богословским. Это послужило толчком к возникновению так называемых факультетских систем классификации, пользовавшихся популярностью на протяжении столетий вплоть до XIX в. Они оказали влияние на выдающиеся для своего времени классификации швейцарского ученого и библиографа К. Геснера (1548) и немецкого философа Г. Лейбница (1700).
Дальнейшее развитие библиотечно-библиографических классификаций проходило под воздействием идей английского философа Ф. Бэкона (1561-1626). Созданная им в начале XVII в. классификация наук группировала знания в соответствии с идеалистической традицией по "способностям человеческого духа". "Память" определяла возникновение истории, "воображение" - поэзии, "разум" - философии, или собственно науки. При всей условности такого деления классификация Ф. Бэкона включала новые отрасли знания и представляла собой значительное событие для науки того времени.
В XIX в. библиотечно-библиографические классификации стали широко разрабатываться в России. Большой интерес представляет схема ученого-натуралиста П. Г. Демидова, составленная им для каталога личной библиотеки. В этой схеме наиболее детализированными были разделы естественных наук и технологии. Заслуживает внимания схема, опубликованная в 1809 г. А. Н. Олениным и предназначенная для императорской СПб Публичной библиотеки, а также оригинальная схема К. Ф. Рейса, предложенная им для библиотеки Московского университета в 1826 г. и основанная на дихотомическом принципе деления. Самостоятельную схему классификации, в основу которой было положено условное деление наук "по потребностям человека", создал для библиотеки Казанского университета К. К.Фойгт в 1843 г.
Одной из лучших в первой половине XIX в. заслуженно считается классификация выдающегося русского натуралиста К. Э. Бэра, которую он разработал для иностранного отделения библиотеки Академии наук в Санкт-Петербурге в 1841 г. В этой классификации была предпринята одна из первых попыток расположить науки в последовательности, отражающей историю развития мира: науки о неорганической природе, науки об органической природе, науки о человеке и обществе.
В библиотеках Западной Европы в этот период особенно широко применялись схемы классификации Ж. Ш. Брюне (1810) и А. Э. Шлейермахера (1847). Первая из них представляла собой одну из поздних разновидностей так называемой французской системы, которая в течение почти двух столетий использовалась в библиографии и книготорговле Франции. Вторая, особенно популярная в библиотеках немецких университетов, была создана на основе старой "факультетской системы". Эти классификации создавались для расположения книг на полках и для систематизации их описаний в каталогах и указателях. Такое их назначение обусловило необходимость линейной последовательности их рубрик и строгого подчинения между классами и подклассами, всегда связанными в этих классификациях родовидовыми отношениями. Одна из наиболее сильных сторон этих языков заключается в том, что классификация по родовидовым признакам всегда служила важным инструментом познания и привычным методом определения понятий.
Иерархические классификации обеспечивают высокую эффективность информационного поиска по широким тематическим запросам, сформулированным в определенном аспекте, который был предусмотрен заранее, при составлении схемы и при индексировании по ней документов. Для реализации подобного поиска наиболее оптимальным техническим средством служит просто перечень (каталог). Эти особенности объясняют прочное положение иерархических классификаций как единственного на протяжении тысячелетий средства поиска документов по их содержанию. Лишь во второй половине XIX в. появилась необходимость в другом типе языка, который упрощал бы для массового читателя разыскание нужных ему рубрик и облегчал бы введение в систему новых понятий без коренной ее перестройки. Таким языком стала алфавитно-предметная классификация, теорию которой в 70–80-х годах прошлого века разработал Ч. Э. Кеттер.
Крупнейшим достижением в области систематизации явилось создание в 1876 г. видным американским библиотечным деятелем М. Дьюи "десятичной классификации". Сам он видел свою основную заслугу в том, что применил в своей схеме децимальную индексацию: "Дело шло о достижении абсолютной простоты путем использования самых простых и известных символов, арабских цифр в виде десятичных дробей в качестве индексов классификации всех человеческих знаний в печатных произведениях"[29]. Однако теперь, по прошествии столетия, значение созданного М. Дьюи нам представляется в другом. Он теоретически обосновал и практически внедрил стандартизацию типовых делений (литературной формы, вида издания и т. п.) в различных разделах схемы и частично лингвистических, этнических и географических делений, использовав прием факультативного превращения в постоянные подразделения окончаний индексов разделов "Филологии" и "Истории".
Другой его важной заслугой было введение в систему алфавитно-предметного указателя, который позволил разыскивать книги по любому предмету независимо от его места в схеме. Идея такого вспомогательного указателя, правда, не была новостью, такие указатели уже применялись в энциклопедиях XIII в., в изданиях эпохи Возрождения, у К. Геснера, в таблицах А. Э. Шлейермахера. Однако только теперь подобные указатели стали неотъемлемой частью классификационных таблиц и систематических каталогов библиотек. Таким образом, впервые была предпринята попытка избавиться от жесткости линейной схемы иерархической классификации и расширить число входов в ее схему. Однако этот шаг был еще очень робким, и принцип проводился не очень последовательно.
Эта непоследовательность была преодолена в "брюссельском варианте" десятичной классификации, которая получила широкое распространение после 1905–1907 гг. как "Универсальная десятичная классификация". Ее создатели выдающиеся бельгийские документалисты П. Отле и А. Лафонтен использовали преимущества десятичной системы, индексация которой понятна людям, говорящим на разных языках, и развили заложенные в ней возможности более гибкого использования иерархической классификации. Идею стандартизации делений схемы они довели до логического конца, создав вспомогательные таблицы типовых делений – общих и специальных (аналитических) определителей. Общие определители (языка, формы документа, места, времени, народности, точки зрения) используются во всех отделах схемы с одним и тем же значением. Специальные определители предназначены для использования только в нескольких отделах одной отрасли знания для их деления по одним и тем же признакам.
Важным достижением УДК явилось также введение принципа комбинации индексов, разработка приемов их присоединения, распространения, отношения и объединения (синтеза), кроме того, было предусмотрено использование индексов подразделений одного раздела в других и введение параллельных (альтернативных) делений для отражения классифицируемых объектов в разных аспектах. Таким образом, на смену прежним "перечислительным" схемам с заранее установленными рубриками и готовыми индексами пришла подвижная схема, в которой нужные рубрики могут создаваться в процессе классификации путем сочетания индексов с определителями или соединения их друг с другом.
К основным достоинствам УДК как иерархической классификации относятся следующие ее характерные черты:
- универсальность, заключающаяся в охвате всех отраслей знания,
- логическая ступенчатая индексация, позволяющая неограниченно делить подклассы без нарушения основной структуры классификации,
- международная применимость благодаря использованию только цифровых десятичных индексов, всем понятных и легко запоминаемых,
- развитая система определителей и комбинационного построения индексов, обеспечивающих относительную гибкость при отражении достаточно узких и сложных понятий,
- устойчивый и четко организованный международный механизм поддержания классификации на уровне новых достижений науки.
В качестве недостатков УДК часто называют ее естественные ограничения, присущие всем иерархическим классификациям. Они не могут удовлетворительно отражать процессы интеграции и взаимопроникновения наук, и в них трудно находить место для направлений и понятий, возникающих на стыке наук. Далеко не все явления в природе и понятия в науке можно связать родовидовыми отношениями. Это особенно ярко проявляется в технике, медицине, в других прикладных, а также в комплексных дисциплинах, таких, например, как кибернетика, информатика, семиотика. Эта ограниченность УДК, в которой отдельные науки жестко разделены в соответствии с формальными логическими правилами, противоречит тенденции синтетического развития науки. Нельзя сказать, чтобы это были недостатки, скорее это внутренние свойства иерархических классификаций, обеспечивающие их эффективность в условиях широкого тематического поиска.
Следующий шаг в развитии комбинационного принципа в классификации был сделан выдающимся индийским библиотековедом Ш. Р. Ранганатаном в созданной им в 1933 г. "Классификации с двоеточием", которая явилась родоначальницей фасетных классификаций. Об их функциях английский информатик Б. Виккери писал: "Потребители хотят иметь возможность отыскать документ, посвященный сложной специальной теме, не только тогда, когда именно она является непосредственным объектом поиска, но также тогда, когда поиск ведется по любому термину или группе терминов, входящих в сложное понятие. Для удовлетворения этих требований необходимо, чтобы не только понятия могли входить в неограниченное количество сочетаний, но также, чтобы в структуре системы были отражены родовые связи понятий и связи между разделами"[30].
Фасетная классификация вместо единого ряда делений в каждом основном классе имеет несколько "фасетов", соответствующих аспектам классифицируемого понятия или предмета. Все существенные термины данного класса распределяются по фасетам и образуют их "фокусы". При индексировании документов их содержание выражается цепочкой фокусов, последовательность которых определяется специальной "фасетной формулой". Примером построения индексов по системе Ш. Ранганатана могут служить следующие фасеты и фокусы из области медицины:
ФАСЕТЫ
Органы тела
Проблемы медицины
Уход и лечение
1 Органы в целом
1 Общие проблемы
1 Питание
2 Органы пищеварения
2 Морфология
2 Этиология
23 Пищевод
3 Физиология
3 Диагностика
24 Желудок
4 Болезни
4 Лечение
25 Кишечник
42 Инфекционные
3 Кровеносная система
421 Туберкулез
4 Органы дыхания
45 Легкие
В этой схеме индекс документа по диагностике инфекционных заболеваний кишечника – 25:42:3, по лечению туберкулеза легких – 45:421:4.
Преимущества этого вида классификаций в том, что они облегчают многоаспектное индексирование документов, позволяя собирать в одном месте все аспекты рассмотрения какого-либо предмета или темы, они легче поддаются изменениям при введении новых понятий, допускают большую глубину индексирования при более коротких индексах. Их применение особенно эффективно при поиске в небольших по объему узкоспециализированных собраниях документов. Видный английский информатик Д. Фоскетт так обосновал достоинства фасетных классификаций: "От схемы не требуется более, чтобы она указывала "место" для каждого документа, включая любой термин или набор терминов в явном виде в классификационные таблицы по каждой предметной области. Эти схемы могут задать набор правил, или рабочих процедур, с помощью которых такие контексты можно, по мере надобности, формулировать на основе тех же самых схем"[31].
Рубрикаторы информационных изданий
В 50-е годы в информатике рубрикаторами стали называть перечни рубрик реферативных журналов и других информационных изданий. В данном случае… Рубрикатор – это особым образом организованный перечень рубрик иерархической… Возникает вопрос, почему же все-таки для создания рубрикаторов не использовались существующие классификации? Можно…
Разные типы информационно-поисковых языков
Мы установили, что дескрипторные информационно-поисковые системы открыли принципиально новую возможность поиска необходимых документов и… Всегда можно найти такую удаленную позицию, такое основание деления, при… Для того, например, чтобы индексировать статью о производстве и экспорте вычислительных и пишущих машин в США, Японии…
Базы и банки данных
Информатики же давно поняли, что переработка знаний связана не только и даже не столько с совершенствованием компьютеров, сколько с организацией… За последние десятилетия значительное развитие получили исследования в области… В среде информационных работников стало привычным говорить о базах и банках данных (БД и БнД). Само по себе это…
Информационные системы
Информационно-поисковые системы
Другой важный фактор, все сильнее воздействующий на сферу информационного поиска, заключается в появлении и росте численности полнотекстовых БД,… Опыт информационного поиска в полнотекстовых БД, когда поиск проводится не по… Проблема информационного поиска весьма существенно усложнилась еще в одном отношении. Если раньше объектом поиска были…
Интеллектуальные информационные системы
В результате развития этих разделов информатики стало возможно создание нового информационного продукта – интеллектуальных систем[34].… Интеллектуальная система =
рассуждающая система + поисковая система + интеллектуальный интерфейс.
Гипертекстовые системы
Возникновение и развитие идеи гипертекста
Компьютерная гипертекстовая технология в самой общей форме понимается как "поддержка связей", т. е. обеспечение максимальной комфортности… Широкое внимание научной общественности к этой идее было привлечено несколько… Теперь становится ясно, что успехи в развитии вычислительной техники и программирования позволили реализовать идеи,…
Логико-смысловой граф и логика связности
Можно трактовать семантические графы не как отображения текстов, а как представление знаний о предметных областях. Это явилось промежуточным этапом… Логико-смысловые графы, действительно, можно рассматривать как одну из версий… Стали значимыми такие характеристики, как число связей высказывания (степень соответствующей вершины графа),…
Гипертекст как развитие функций чтения и письма
В соответствии с этим в применении гипертекстовых систем сложилось несколько основных направлений. Одно из них – "электронная книга» –… Коммерческие гипертекстовые системы выпускаются с 1987 г. Наибольшую… Система Hypercard фирмы Apple для персональных компьютеров Macintosh представляет собой своеобразную электронную…
Отечественные гипертекстовые системы ГИПЕРЛОГ и СЕМПРО
– формировать из элементов гипертекстовой базы данных связные, упорядоченные тексты на задаваемые пользователем темы;
– контролировать качество формируемого текста, выявлять в нем логические и… – структурировать гипертекстовую базу данных, выявлять в ней комплексы тесно взаимосвязанных идей, понятий, проблем.
…
Системы гипермедиа как развитие гипертекста
Информационные системы, обеспечивающие функционирование гипермедиа, должны иметь особые технические, программные и телекоммуникационные средства.… – указатель к гиперБД, содержащий аннотированный перечень характеристик всего… – карта связей гиперБД, отражающая в графической форме ее структуру и методы доступа к информации;
Системы машинного перевода
Многие выдающиеся лингвисты вообще ставили под сомнение – и не без основания – возможность адекватного перевода текстов с одного естественного языка… Человеческий перевод текстов с одних естественных языков на другие – это… Концепция фразеологического машинного перевода была впервые четко сформулирована профессором Г. Г. Белоноговым в 1975…
Информационная технология
О понятии информационной технологии
Вот почему термин "информационная технология", пришедший к нам из английского языка, часто трактуется расширительно и охватывает не только… Информационные технологии не являются самоцелью: их разработка и внедрение… Информационная технология нередко включается в более широкое понятие информационной сферы, которая представляет собой…
Тенденции развития информационных технологий
В обобщенном виде эти тенденции таковы. Увеличение числа полнотекстовых баз данных и расширение производства оптических дисков углубляет процесс… Таким образом, специалисты могут формировать собственные базы данных, получая… Возможно, что именно последней из названных тенденций объясняется то, что библиотеки пока еще не играют заметной роли…
Влияние информационных технологий на развитие науки
Наиболее сильно влияют на развитие науки следующие изменения в информационной технологии:
а) рост производительности компьютеров при снижении стоимости обработки… б) возможность хранения в машиночитаемой форме больших объемов информации. Появление компактных оптических дисков с их…
Социальные последствия новой технологии
В начале нашего века в структуре занятого населения США люди, занятые переработкой информации (включая образование, науку, культуру, организационное… Возникнув и быстро совершенствуясь, электронные информационные технологии… Не следует забывать урока, который несколько десятилетий назад преподал нам М. Маклюэн, считавший средства…
Компьютерные средства коммуникации
Электронные вычислительные машины
Теоретически устройства для переработки информации могут быть реализованы и с применением иных принципов. С другой стороны, далеко не все тенденции… Наше внимание, напротив, привлекают далеко еще не освоенные возможности… Быстрое развитие и внедрение компьютеров в различные сферы жизни происходит на протяжении нескольких последних…
Новые поколения компьютеров
Рис. 11. Модель Дж.фон Неймана: однопроцессорный компьютер.
Персональный компьютер и персональные вычисления
Появление персонального компьютера уже обросло типичной американской легендой. В ней рассказывается о том, как в начале 70-х годов два молодых… Разумеется, в действительности все было не так просто. Однако, глядя на… Что же представляет собой персональный компьютер? Академик А. П. Ершов определял его как массово выпускаемую…
Работа с текстом на компьютере
О языках программирования
В наши дни особое внимание уделяют составлению текстовых описаний к новым программам, поскольку освоение этих программ требует большого труда и… Не будучи специалистом, трудно говорить о вычислительных машинах, но еще… Сравнение компьютера с автомобилем, а программирования – с управлением механистично и мало что объясняет, компьютера с…
Quot;Прибыль = доход – затраты".
Действия, описываемые этими формулами, транслируются в машинные коды компиляторами и интерпретаторами, которые можно считать средствами реализации языка программирования. На этом и были основаны такие языки программирования, как Фортран, Паскаль, Бейсик.
Эти и подобные им языки называются процедурными. Каждый такой язык как бы предоставляет программисту некую виртуальную (воображаемую) машину. Составляя программу, пользователь видит решение своей задачи как процесс вычисления, осуществляемый этой виртуальной машиной. Тем самым сразу описывается и задача, и метод ее решения. Появились непроцедурные стили программирования – функциональный, логический – и соответствующие языки. Основная идея логического программирования – отделение описания задачи от процесса ее решения – была выражена в уравнении одного из его авторов Р. Ковальского:
Quot;Алгоритм = логика + управление".
Наиболее распространенный язык логического программирования П р о л о г был создан в 1972 г. А. Колмари из Марсельского университета. Программа на Прологе состоит из описаний, задающих объекты и отношения между ними. Например, формула
"Площадь = длина X ширина"
описывается отношением "Произведение, длина, ширина, площадь". Описание это статическое и никаких вычислений оно не задает. Но компьютер производит их сам по запросу, и по любым в данном случае двум величинам может вычислить третью, т. е. по площади и ширине – длину. Независимо от зарубежных работ в СССР в 70-е годы В. Б. Борщевым и М. В. Хомяковым (ВИНИТИ) также разрабатывалась версия логического программирования.
Многие современные компьютерные системы используют язык С и, созданный в 1972 г. Д. Риччи в лабораториях "Белл Телефон" корпорации АТТ в Мюррей-хилл (шт. Нью-Джерси). Первоначально он разрабатывался для программировании новой операционной системы Ю н и к с. Операционная система предназначена для приема, хранения и выдачи информации, а также для взаимодействия аппаратных средств компьютера с прикладными программами. Си стал популярным как язык так называемого среднего уровня. В нем удобство, краткость и мобильность языков высокого уровня сочетаются с возможностью непосредственного доступа к машине, что традиционно обеспечивалось ассемблером, т. е. языком низкого уровня.
Другая важная тенденция в развитии программирования связана с объектно-ориентированными языками. В них процессор машины условно делится на "объекты", которые могут программироваться индивидуально, а затем соединяться друг с другом при помощи сообщений. В числе подобных языков: С и м у л а - 67 (О. Даль и К. Нигард из Норвежского ВЦ в Осло), С м о л л т о к (1970 г., А. Кей из фирмы Ксерокс, Пало-Альта), Э у р и с к о (1979 г., Д. Ленат из Стэнфордского университета).
Прикладные программы подготовки текстов
Программное обеспечение вычислительных машин можно условно разделить на системное и прикладное. К системному относятся операционные системы, о… Для нас наиболее важными являются те пакеты, которые применяются для… Ввод текста при помощи такой программы осуществляется как на пишущей машинке: буква за буквой с пробелами между…
Quot;Понимание" текста на естественном языке
Моя позиция заключается в том, что адекватный перевод текстов с одного естественного языка на другой – задача, не имеющая однозначного решения.… Обсуждая возможность адекватного перевода, полезно представить мысленно… Нас, в данном случае, интересуют те типы текстов, которые занимают довольно большое пространство в центре шкалы и…
Электронная книга
Новая концепция книги
В самом широком (общем) смысле книгой часто называется физическая форма законченного и единого произведения печати или письменности. Под… С точки зрения физической формы любой компьютерный файл является программой,… Важное для книги понятие тиража в данном случае теряет смысл. По всей вероятности, искать опору в выявлении этого…
Сущность, особенности и разновидности электронной книги
Некоторые ее виды можно не только читать, но и изменять, добавляя собственные наблюдения, размышления и результаты экспериментов (если все файлы… В настоящее время сотни журналов и тысячи книг ежегодно выпускаются в… Такая модель иногда называется "гиперкнигой". Сохраняя многие черты печатных книг с учетом функций…
Электронный журнал: проблемы распространения и хранения
Наиболее интересными проектами подготовки электронных журналов являются проект Muse Издательства Университета Джонса Хопкинса (Балтимор, шт.… Интернетреволюционным образом изменил возможности неформальной научной… В связи с электронными книгой и журналом возникают и новые «жанры» научной коммуникации, пока еще не очень хорошо…
Организационные и юридические проблемы
Если говорить о распространении электронных изданий, то здесь возникает много проблем, которые также нельзя решить на основе традиционного опыта.
… Авторское право. Особенно большие затруднения возникают, когда на электронные… Впервые создатели и читатели электронных книг и журналов столкнулись с проблемами авторского права совсем недавно, с…
Электронная библиотека реальная и виртуальная
На этот раз вызов оказывается посерьезнее. В течение, по меньшей мере, пяти тысячелетий библиотека работала с текстовыми, по преимуществу,… Проблема, стоящая перед библиотечным делом и ее наукой – библиотековедением,… Убежден, что мультимедийные средства передачи знаний быстро овладеют сферами науки, образования, просвещения, т. е.…
Лучше ли электронная книга традиционной печатной?
Доводы за электронную книгу
- осуществлять быстрый поиск заданной информации (по выделенному ключевому слову или так называемой "горячей области");
- по требованию пользователя предоставлять ему справочную информацию по… - обеспечивать интерактивный режим работы пользователя;
Доводы против электронной книги
Создатели электронных устройств для чтения усиленно работают над исправлением этих недостатков. Корпорация "Microsoft" проводит испытания,… Зависимость от связи с Интернет и электричества.Традиционную книгу можно… Проблема защиты авторского права.Благодатные времена настали сейчас для пиратов авторского права. В бумажном мире…
Заменит ли электронная книга бумажную?
Возможно, споры будут идти до тех пор, пока история не докажет, кто был прав. Оптимальным выводом кажется то, что электронная книга в ближайшие годы… С другой стороны, остается нерешенной проблема организации нового массива…
Сведения об Интернет
Интернет как глобальная компьютерная сеть
Интернет началась в 1969 г. с сети Арпанет (ARPANET – Advanced Research Projects Agency Network), которую финансировал Пентагон с целью… В последние несколько лет, когда задача создания национальной информационной… Каждый человек видит секрет успеха Интернет по-своему. Одни считают, что Интернет олицетворяет успех нерегулируемого,…
Организация доступа к первоисточникам
Научно-техническая информация
EasyNet 2.0 ($) (http://www.telebase.com/) – коммерческая служба фильтрации и доставки информации через Интернет, организованная шлюзовой службой… UnCover Periodicals (http://www.carl.org/uncover/unchome.html) – служба… Internet Patent Search (http://sunsite.unc.edu/patents/ intropat.html) – сервер, предлагающий услуги поиска патентной…
Политическая информация
Специалисты выделяют четыре основных причины популярности использования Интернет в политической борьбе: (1) низкая стоимость создания Web страниц… Через Интернет избиратели могут получить пресс-релизы, тексты речей,… В области российской политической информации работают как отечественные, так и зарубежные серверы. Например, Политика…
Новости и литература в электронной форме
Новости и литература в Интернет являются одним из основных информационных ресурсов. Интернет обеспечивает более оперативный доступ к новостям, чем сами агентства новостей, так как работая с сетью, пользователь получает доступ к источнику новостей в электронной форме практически одновременно с их генератором – Reuter, Time Warner, The New York Time, CNN и др. – то есть находится с ним в примерно равных условиях.
Использование сервера новостей имеет ряд преимуществ по сравнению с телевизионной программой: интерактивный доступ к большим объемам информации и простота выбора из них, возможность сохранения нужной информации в мультимедийном виде (с фото, картами, интервью) и т. п. Большинство ведущих газет и журналов мира сегодня уже имеют серверы Интернет, и через них необходимую информацию можно получить намного дешевле и быстрее, обычно еще до выхода печатной версии.
Важнейшие серверы новостей, доступных через Интернет:
* CNN (http://www.cnn.com) – предоставляет доступ к новостям еще до отражения их на экранах телевизоров, а информация обновляется каждые полчаса и группируется по нескольким основным разделам;
* The New York Times (http://www.nytimes.com) – информация появляется за несколько часов до выхода газеты.
Среди служб, уже сегодня предлагающих пользователям персональные газеты, подготовленные с использованием систем фильтрации информации и доступные через Интернет:
* The Times (http://www.the-times.co.uk/) – бесплатная персональная газета Personal Times, подготавливаемая на основе материалов газет The Times и Sunday Times;
* IBM (http://www.infosage.ibm.com/) – персональная газета InfoSage, подготавливаемая на основе материалов служб новостей и предлагаемая по подписке;
* Los Angeles Times (http://www.latimes.com/) – бесплатная персональная газета Hunter, подготавливаемая на основе материалов LA Times и агентств новостей;
* Adaptix (http://www.daptix.com/) – бесплатная персональная газета Rex, подготавливаемая на основе новостей, представленных в Интернет;
* Pointcast (http://www.pointcast.com/) – бесплатная персональная газета Pointcast Network (PN), подготавливаемая на основе материалов агентств новостей и некоторых ведущих американских газет.
Почти все ведущие российские службы новостей имеют собственные серверы WWW. В качестве примеров можно назвать:
* РИА Новости (http://ss10.elvis.msk.su/alexey-bin/RIAN-Index.rus);
* ТАСС (http://www.trib.com/WIRE/TASS/INERNATONAL/);
* TADI (http://www.tadi.tomsk.su/) – сервер информационного агентства TADI.
Сектор новостей привлек внимание и новых коммерческих структур. Например, в середине мая 1996 г. компания Bit Software устроила презентацию работы систем распознавания текста в Национальной службе новостей (НСН) (http://www.nns.ru), в рамках которой в компьютерную форму преобразуется около 240 российских периодических изданий (до 800 газетных страниц ежедневно), включая 160 ежедневных газет. Этот проект может принести России своеобразный аналог службы Lexis-Nexis. НСН не только предоставляет доступ к тексту изданий, но и включает в себя несколько тематических и обзорных блоков, например, таких как:
Информационно-справочная система Выборы; Федеральная власть России; Политические партии и общественные движения; Группы влияния (СМИ, аналитические центры, экономические структуры); Дайджесты и обзоры СМИ; Пресс-рейтинги; Регионы России; Телефонный справочник федеральных органов РФ; Карты стран бывшего СССР; Хроника законодательной деятельности; Календарь ожидаемых событий.
Многие российские электронные газеты и журналы имеют электронные версии. Помимо уже названных это:
* Аргументы и факты (http://205.198.180.2/AiF/);
* Независимая газета (http://www.glas.apc.org/ng/index.html);
* Учительская газета (http://www.redline.ru/ug);
* Иностранец (http://www.elvis.msk.su/koi8/foreigner/index.html);
* Экстра-Пресс (http://angar.dtk.kiae.su/Express/Welcome.html);
* Эхо-Инфо (http://www.uniphys.spb.su/IHQ/HTML/HelpInfo.html);
* С.-Петербургское эхо (http://www.dux.ru/win/enpp/newspapers/echo/echohome.html);
* Неделя (http://www.astro.ru/centro/) – электронная газета, включающая два раздела: справочная информация (справочные базы данных и в т. ч. коммерческая информация); развлекательная информация (кино, театры, концерты, программа телевидения, музеи, выставки и т. п.);
* Сегодня (http://www.eastview.com/segodnia/index.html);
* St. Petersburg Press (http://www.spb.su/sppres);
* Экспресс-хроника (http://www.online.ru/nlist/expchronicle/choronicle~weekly/).
В числе российских электронных изданий журналов, доступных через Интернет, можно назвать:
* Огонек (http://www.ropnet.ru/ogonyok/win/tech-sup html);
* Скифы (http://www.simtel.ru/cgi-bin/snews.pl/simbirsk.skyfy) [96];
* Лица (http://www.izhmark.udmurtia.su/~vd.faces);
* Реклама-Шанс (http://www.chance.sp.su/);
* Ярмарка (http://www.mplink.ru/public/jarmarka/Head.html);
* Независимое военное обозрение (http://glasnet.ru/ng/);
* Знакомства (http://www.astro.ru/cgi-bin/emz/emz/).
Говоря о литературе в Интернет, специалисты отмечают, что эта сеть как бы продолжила традицию самиздатовских ксероксных элитарных литературных, политических и музыкальных журналов, распространяемых всего в нескольких десятках экземпляров, и тем ни менее, получающих значительный общественный резонанс. Эти бюллетени зародились еще в рамках систем электронной почты и получили наименование e-zine (вместо magazine – печатный журнал), а теперь именуются web-zines. Главным в этих изданиях, распространяемых через Web, выступает не только доступность и широта распространения, но и гипертекст и мультимедийность.
В Интернет помимо деловых и специальных уже есть настоящие литературные и литературно-критические журналы, например:
* Salon (http://www.salon1999.com);
* Hotwired (http://www.hotwired.com);
* Word (http://www.word.com);
* Feed (http://www.feedmag.com);
* Suck (http://www/suck.com) [36].
Российская электронная литература представлена Публичной электронной библиотекой содержащей произведения Есенина, Пушкина, Тургенева, Чехова (http://win.www.online.ru/sp/eel/russian/),.
Среди российских литературно-художественных электронных журналов, доступных через Интернет:
* Не спать – журнал для ночных жителей Москвы (http://www.enjoy.ru/);
* Пятое колесо (http://www.chance.sp.su/);
* Комиксы (http://win.www.online.ru/rmain/rentert/rcomics.xhtml);
* Magazine – Online (http://win.www.online.ru/sp/magazine/);
* Юношеская газета (http://www.glas.apc.org/~asebran/edut/publicat.html);
* Петербургский журнал искусств (http://warcom.spb.su/art/frontdoor.html)
* БИТ (http://www.spb.su/beat/1/koi/index.html)
Некоторые Web страницы по русской литературе представлены на зарубежных серверах. Например, на странице Русская литература в Интернет собраны ссылки на все существующие в WWW российские газеты и журналы, а также на коллекции прозы, поэзии и песен(http://iaiwww.uni-muenster.de/cgi-bin/simplex/lat/lit.html).
В числе ведущих источников справочной информации общего назначения в Интернет:
* Argus Clearinghouse (http://www.lib.unmich.edu/chouse/) – справочник по предметно-ориентированным справочникам ресурсов Интернет;
* CIA World Factbook (http://www.odci.gov/cia/publications/96 fact/index.html) – сервер ЦРУ, через который предоставляется информация по всем странам мира, включая экономическую статистику, карты, характеристику политической обстановки и т. п.
* Britanica (http://www.eb.com/) – электронная Web версия Британской энциклопедии, включающая более широкий состав статей и иллюстраций, чем печатная и 200 тыс. гипертекстовых связей;
* Webster's Dictionary (http://c.gp.cs.cmu.edu:5130/prog/webster) – Web версия словаря Webster c разнообразными гипертекстовыми связями.
В Web представлены все крупные издательства, которые предлагают пользователю информацию о своей работе и планах, а также каталоги публикаций и интервью с авторами. На многих страницах можно ознакомиться с проспектами еще не вышедших книг или статьями в работе, а также деловыми новостями из области издательской деятельности и полиграфии. Среди Web страниц издательств:
* Bantan Doubleday Dell (http://www.bdd.com/);
* HarperCollins (http://www.harpercollins.com/);
* Random House (http://www.randomhouse.com/);
* Penguin (http://penguin.com/);
* Little, Brown (http://pathfinder.com/twep/Library/Library.html) [42].
* McGraw-Hill (http://www.mcgraw-hill.com/);
* Macmillan (http://www.mcp.com/);
* Oxford University Press (http://www.oup.co.uk/ouphome.html);
* Ventana (http://www.vmedia.com/);
* West Publishing (http://www.westpub.com/);
* John Wiley & Sons (http://wiley.com/);
* Ziff-Davis (http://ziff.com/) [42].
Развлекательная и бытовая информация
Потребительская развлекательная и бытовая информация представлена ресурсами в области: образования; музыки; музеев, галерей и художественных выставок; фильмов и фото; спорта; развлечений; бытовой информации.
Образование
* ICS Learning Systems (http://www.icslearn.com/) – сервер одной из крупнейших в мире служб заочного образования, организованной в 1890 г. и с тех… * CIBER Web (http://www2.mgmt.purdue.edu/Centers/CIBER/ciber.htm) – сервер… * Training & Seminar Locator (http://tasl.com/tasl/home.html) – сервер, предлагающий доступ к базе данных по…
Музыка
Доступ к страницам, предлагающим потребителям развлекательную информацию в области музыки и музыкальные произведения, постоянно расширяется. В России такого рода страницы также имеются в достаточно большом количестве и предлагают пользователю многообразие жанров:
* Interactive Music Encyclopedia (Announcements) (http://www.fe.msk.ru/win/ime.html);
* Музыка (http://win.www.online.ru/rmain/rentert/rmusic.xhtml);
* Фестиваль экстремальной музыки (http://www.fe.msk.ru/win/feelee/welcome.html) – страница, на которой представлена информация о рок-группе Наутилус Помпилиус, группе ЛЮБЭ, Наталии Штурм и Александре Новикове;
* Русская классическая музыка (http://www.fe.msk.ru/win/records/welcome.html);
* Авторская песня (http://win.www.online.ru/mlist/ksp/news/);
* Alien Network (http://lobin.alien.ru/) – музыкальная страница, предлагающая тексты песен.
Музеи, галереи и художественные выставки
* WebMuseum (http://sunsite.unc.edu/wm) – постоянно расширяющаяся коллекция наиболее известных произведений живописи, формирование которой начал… * Real Louvre (http://www.louvre.fr) или (http://www.paris.org) – сервер,… * Christus Rex (http://www.cristusrex.org) – коллекция частной некоммерческой организации, распространяющей…
Кино и фотография
* Фильмотека (http://win.www.online.ru/rmain/rentert/rfilm.xhtml);
* Russian Top Cartoonist – Victor Bogorad (http://www.spb.su/victor/);
* ElectronicPhotoGalleryHotPictures (http://www.kiae.su/www/wtr/hotpictures/gallery.html).
Спорт
Россия Онлайн Спорт (http://win.www.online.ru/rmain/rentert/rsport.xhtml).
The Russian Football Homepage (http://www.quark.lu.se/~oxana/football.html) – данные о футбольной статистике, составе команд, результатах игр Российской сборной и клубных команд [96].
Развлечения
Игры (http://win.www.online.ru/rmain/rentert/rgames.xhtml);
Танцы (http://win.www.online.ru/rmain/rentert/rdance.xhtml);
Юмор (http://win.www.online.ru/rmain/rentert/rhumor.xhtml);
Русский юмор (http://www.pa.uky.edu/~verner/lat.cgi/an.html);
Н.Ж.М.Д. (http://pobox.com/~tema/rrr/choose.html).
Бытовая информация
* Local Time Around the World (http://www.hilink.con.au/times/) – сервер, через который можно получить сведения о местном времени в большинстве… * World Telephone Area Codes (gopher://gopher.cs.ttu.edu:4320/worldareacode)… * Currency Conversions (http://bin.gnn.com/cgi-bin/gnn/currency) – система расчета курсов всех валют мира через…
Информация по Интернет
* NetlnSights (htto://www.netnsights.com) – конференции по изучению путей развития Интернет;
* Open Market's Internet Index… * The Internet Reference Guide (htto://204.120.185.2/netindex.html) – системы обучения работе с Интернет.
Заключительная лекция
Идеи и методы информатики
– координатное индексирование документов и других объектов соответствующими характеристиками – ключевыми словами и дескрипторами;
– использование в качестве дескрипторов классов условно эквивалентных ключевых… – инвертированная организация поисковых массивов;
Поиски фундаментального закона
В четырех последовательных номерах английского "Journal of Information Science" (1980.– Vol. 2, N 3–6; 1981.– Vol. 3, N 1) была… Б. Брукс справедливо полагал, что информатика должна опираться на… K [S] + DI = K [S + DS],
Определение и предметная область информатики
Зарубежные специалисты иногда посмеиваются над нашим, как им кажется, чрезмерным пристрастием к обсуждению чисто терминологических проблем.… Наибольшее понимание вызывает позиция А. П. Ершова, который считал, что… Менее приемлемой представляется позиция А. А. Дородницына, который определял состав информатики как "три…
Перспективы информатики
общие вопросы теории и методологии,
организация информационной деятельности,
документальные источники информации,
Словарь терминов
Адаптер – набор электронных цепей для связи процессора с периферийными устройствами.
База данных – совокупность взаимосвязанных данных, хранящихся во внешней… База знаний – формализованная совокупность сведений о некоторой предметной области, содержащая данные о свойствах…