Язык запросов русскоязычных поисковых систем
Реферат подготовила ученица 11 класса Зимина Марина
МОУ Коробовская СОШ
Управления образования Администрации Шатурского района
Московской области
2005 год
Введение.
При
проведении поиска информации в службе www, когда тема задана достаточно широко,
целесообразно использовать поисковые каталоги и поисковые указатели. Знание
основных понятий и терминов позволяет провести углубленный поиск с применением
ключевых слов, наиболее точно характеризующих искомую тему. При этом следует
различать приемы простого, расширенного и контекстного поиска.
Под
простым поиском понимается поиск Web-ресурсов по ключевому слову. Недостаток
этого вида поиска заключается в том, что обычно он выдает слишком много
документов, причем наряду с ценной информацией попадается много «мусора».
При
использовании расширенного поиска ключевые слова связываются между собою операторами
логических отношений(так называемый язык запросов). При помощи логических
отношений поисковое задание формулируется так, чтобы более точно детализировать
задание и ограничить область отбора.
Контекстный
поиск – это поиск по точной фразе. К сожалению доступен не во всех поисковых
системах. К тому же эта операции достаточно медленная.
Язык
запросов – язык манипулирования данными, позволяющий описывать условия поиска
информации, не задавая для этого последовательность действий, нужных для
получения ответа.
Порядок
действий логических операторов: сначала выполняются действия в скобках ( ),
потом операторы AND, NOT и лишь потом OR.
В
разных поисковых системах используются различные приемы связывания между собой
ключевых слов при помощи логических операторов. В дальнейшем будут приведены
правила построения запросов в трех наиболее распространенных русскоязычных
системах.
Язык запросов в поисковой системе РАМБЛЕР
[1]
Написано
Результат поиска
Примечания и примеры
идти
Все формы по правилам русского
языка
найдётся идти, идёт, шёл, шла и
т.д.
Регистр (shift)
Если подряд идёт не менее чем
два, три или четыре слова с большой буквы, то будет производиться только по
имени собственному
ДОМ и дом, nOt и Not воспринимаются
одинаково
слово1 пробел слово 2
слово 1 & слово 2
слово 1 AND слово 2
Будут найдены все документы, где
в одном предложении есть оба слова
машина самолёт
машина & самолёт
машина AND самолёт
Слово 1 or слово 2
Слово 1 | слово 2
Будут найдены документы, содержащие
или одно слово, или другое
самолёт or аэродром
самолет | аэродром
Слово 1 not слово 2
Слово 1! слово 2
Будут найдены документы, содержащие
первое слово, но без второго
машина not самолёт
машина! самолёт
" "
Слова, заключенные в двойные
кавычки, ищутся в документах именно в том порядке и в тех формах, в которых они указаны в
запросе*
самолёт "заправился"
посадка не будет найдено: самолёт совершил посадку, чтобы заправиться
(X,Y)
Будут найдены документы, в которых
расстояние между словами не более Х слов
(2,красная армия) между словами
не стоит ни одного слова, поскольку лишь в случае непосредственного их соседства
разница в порядковых номерах слов меньше 2, по умолчанию максимальное расстояние
– 40 слов
( )
Сначала слова
группируются по операторам AND и NOT, и лишь потом по операторам OR
машина (самолёт |
аэродром)
машина и одно из слов
самолёт
или аэродром
${counter =ID}
Будут найдены
страницы, на которых размещены счетчики Top100, TopShop, TopList, SpyLog,
HotLog
сounter – это
название счетчика, а ID – это номер счетчика ${top100 =193680}- это открытки
Оформление запросов в поисковой системе Яндекс
[2]
Написано
Результат поиска
Примечания и примеры
идти
Все формы по правилам русского
языка
найдётся идти, идёт, шёл, шла и
т.д.
Путина
путина
Если вы набрали слово с большой
буквы, будут найдены только слова с большой буквы, в противном случае будут
найдены как слова с большой, так и с маленькой буквы
по запросу ‘путина’ найдется и
президент, и сезон интенсивного рыболовства. А по запросу ‘Путина’ –
президент и те случаи рыболовного сезона, когда он написан с большой буквы.
слово 1 && слово 2
слово 1 & слово 2
+слово 1 +слово 2
Будут найдены документы, в
которых есть оба слова
лечебная &
физкультура
+лечебная +физкультура
одинарный оператор ищет в
пределах предложения, двойной – в пределах документа
слово 1 ~~ слово 2
слово 1 ~ слово 2
слово 1 –слово 2
Будут найдены документы с
первым словом, но без второго
руководство Visual C ~~ цена
рак -гороскоп
одинарный оператор ищет в
пределах предложения, двойной – в пределах документа
именно знак минус, а не тире и
не дефис через пробел от предыдущего и слитно с последующим словом
слово 1 пробел слово 2 пробел
слово 3
Будет найдено много документов
с этими словами
частные объявления продажа
велосипедов
несколько слов, разделённые
пробелами, означают, что все они должны входить в одно предложение искомого
документа
слово 1 | слово 2
Будут найдены документы либо с
первым словом, либо со вторым
фото | фотография
Таблица «Оформление запросов в
поисковой системе «Яндекс» (продолжение)
" "
Будут найдены документы, в
которых слова, заключенные в кавычки, идут подряд
"красная шапочка"
контекст "а шапочка у неё
была красная" найден не будет
!слово
Будут найдены документы,
содержащие это слово
!Лужкову
слово 1 /число слово 2
Будут найдены документы, в
которых первое слово находится на расстоянии заданного числа от второго
поставщики /2 кофе
найдутся "поставщики
колумбийского кофе", "поставщики кофе из Колумбии" и т.д.
слово 1 /(+n –n)
слово 2
Будут найдены документы, в
которых известны расстояния между словами
+n – это минимальное число
слов, а –n – максимальное
музыкальное /(-2 4) образование
музыкальное должно находиться
от образования в интервале от 2 слов слева до 4 слов справа
если знаки ограничения стоят
после двойных операторов, то употреблённые там числа – это расстояние не в
словах, а в предложениях
$title X
Будут найдены документы с
заголовком Х
$title Comp Tek
ищет в заголовках документов слово
Comp Tek
$anchor (X | Y)
Будут найдены документы, в
ссылках которых есть одно из слов Х или Y
$anchor (Comp Tek | Dialogic)
#url="www.X.ru"
Ограничить поиск информации
сервером Х
Comp Tek
#url=www.comptek.ru
упоминание компании Comp Tek на
сервере www.comptek.ru и в адресах начинающихся с данной последовательности
символов
#linkl="http://www.x.ru/*"
Будут найдены документы,
содержащие ссылки на определённые URL
#linkl=www.comptek.ru*
найдутся документы, которые
сослались на сервер компании
#image="X*"
Будут найдены документы,
содержащие ссылки на документы с изображениями Х
#image="tort*"
найдутся ссылки на документы с
изображением тортов
возможно, найдётся и портрет
черепахи Тортиллы
#hint=(X)
Будут найдены документы,
содержащие изображение с подписью Х
#hint=(кино)
документы, содержащие
изображение с подписью кино
Таблица. «Оформление запросов в
поисковой системе Яндекс» (окончание)
#keywords=(X Y Z)
#abstrakt=(X Y Z)
Будут найдены документы по
ключевым словам и аннотациям X Y Z
keywords – краткое описание
содержания страницы. Эта служебная информация и она не видима на странице
Х