Язык запросов русскоязычных поисковых систем
Реферат подготовила ученица 11 класса Зимина Марина
МОУ Коробовская СОШ
Управления образования Администрации Шатурского района Московской области
2005 год
Введение.
При проведении поиска информации в службе www, когда тема задана достаточно широко, целесообразно использовать поисковые каталоги и поисковые указатели. Знание основных понятий и терминов позволяет провести углубленный поиск с применением ключевых слов, наиболее точно характеризующих искомую тему. При этом следует различать приемы простого, расширенного и контекстного поиска.
Под простым поиском понимается поиск Web-ресурсов по ключевому слову. Недостаток этого вида поиска заключается в том, что обычно он выдает слишком много документов, причем наряду с ценной информацией попадается много «мусора».
При использовании расширенного поиска ключевые слова связываются между собою операторами логических отношений(так называемый язык запросов). При помощи логических отношений поисковое задание формулируется так, чтобы более точно детализировать задание и ограничить область отбора.
Контекстный поиск – это поиск по точной фразе. К сожалению доступен не во всех поисковых системах. К тому же эта операции достаточно медленная.
Язык запросов – язык манипулирования данными, позволяющий описывать условия поиска информации, не задавая для этого последовательность действий, нужных для получения ответа.
Порядок действий логических операторов: сначала выполняются действия в скобках ( ), потом операторы AND, NOT и лишь потом OR.
В разных поисковых системах используются различные приемы связывания между собой ключевых слов при помощи логических операторов. В дальнейшем будут приведены правила построения запросов в трех наиболее распространенных русскоязычных системах.
Язык запросов в поисковой системе РАМБЛЕР [1]
Написано
Результат поиска
Примечания и примеры
идти
Все формы по правилам русского языка
найдётся идти, идёт, шёл, шла и т.д.
Регистр (shift)
Если подряд идёт не менее чем два, три или четыре слова с большой буквы, то будет производиться только по имени собственному
ДОМ и дом, nOt и Not воспринимаются одинаково
слово1 пробел слово 2
слово 1 & слово 2
слово 1 AND слово 2
Будут найдены все документы, где в одном предложении есть оба слова
машина самолёт
машина & самолёт
машина AND самолёт
Слово 1 or слово 2
Слово 1 | слово 2
Будут найдены документы, содержащие или одно слово, или другое
самолёт or аэродром
самолет | аэродром
Слово 1 not слово 2
Слово 1! слово 2
Будут найдены документы, содержащие первое слово, но без второго
машина not самолёт
машина! самолёт
" "
Слова, заключенные в двойные кавычки, ищутся в документах именно в том порядке и в тех формах, в которых они указаны в запросе*
самолёт "заправился" посадка не будет найдено: самолёт совершил посадку, чтобы заправиться
(X,Y)
Будут найдены документы, в которых расстояние между словами не более Х слов
(2,красная армия) между словами не стоит ни одного слова, поскольку лишь в случае непосредственного их соседства разница в порядковых номерах слов меньше 2, по умолчанию максимальное расстояние – 40 слов
( )
Сначала слова группируются по операторам AND и NOT, и лишь потом по операторам OR
машина (самолёт | аэродром)
машина и одно из слов самолёт
или аэродром
${counter =ID}
Будут найдены страницы, на которых размещены счетчики Top100, TopShop, TopList, SpyLog, HotLog
сounter – это название счетчика, а ID – это номер счетчика ${top100 =193680}- это открытки
Оформление запросов в поисковой системе Яндекс [2]
Написано
Результат поиска
Примечания и примеры
идти
Все формы по правилам русского языка
найдётся идти, идёт, шёл, шла и т.д.
Путина
путина
Если вы набрали слово с большой буквы, будут найдены только слова с большой буквы, в противном случае будут найдены как слова с большой, так и с маленькой буквы
по запросу ‘путина’ найдется и президент, и сезон интенсивного рыболовства. А по запросу ‘Путина’ – президент и те случаи рыболовного сезона, когда он написан с большой буквы.
слово 1 && слово 2
слово 1 & слово 2
+слово 1 +слово 2
Будут найдены документы, в которых есть оба слова
лечебная & физкультура
+лечебная +физкультура
одинарный оператор ищет в пределах предложения, двойной – в пределах документа
слово 1 ~~ слово 2
слово 1 ~ слово 2
слово 1 –слово 2
Будут найдены документы с первым словом, но без второго
руководство Visual C ~~ цена
рак -гороскоп
одинарный оператор ищет в пределах предложения, двойной – в пределах документа
именно знак минус, а не тире и не дефис через пробел от предыдущего и слитно с последующим словом
слово 1 пробел слово 2 пробел слово 3
Будет найдено много документов с этими словами
частные объявления продажа
велосипедов
несколько слов, разделённые пробелами, означают, что все они должны входить в одно предложение искомого документа
слово 1 | слово 2
Будут найдены документы либо с первым словом, либо со вторым
фото | фотография
Таблица «Оформление запросов в поисковой системе «Яндекс» (продолжение)
" "
Будут найдены документы, в которых слова, заключенные в кавычки, идут подряд
"красная шапочка"
контекст "а шапочка у неё была красная" найден не будет
!слово
Будут найдены документы, содержащие это слово
!Лужкову
слово 1 /число слово 2
Будут найдены документы, в которых первое слово находится на расстоянии заданного числа от второго
поставщики /2 кофе
найдутся "поставщики колумбийского кофе", "поставщики кофе из Колумбии" и т.д.
слово 1 /(+n –n)
слово 2
Будут найдены документы, в которых известны расстояния между словами
+n – это минимальное число слов, а –n – максимальное
музыкальное /(-2 4) образование
музыкальное должно находиться от образования в интервале от 2 слов слева до 4 слов справа
если знаки ограничения стоят после двойных операторов, то употреблённые там числа – это расстояние не в словах, а в предложениях
$title X
Будут найдены документы с заголовком Х
$title Comp Tek
ищет в заголовках документов слово Comp Tek
$anchor (X | Y)
Будут найдены документы, в ссылках которых есть одно из слов Х или Y
$anchor (Comp Tek | Dialogic)
#url="www.X.ru"
Ограничить поиск информации сервером Х
Comp Tek
#url=www.comptek.ru
упоминание компании Comp Tek на сервере www.comptek.ru и в адресах начинающихся с данной последовательности символов
#linkl="http://www.x.ru/*"
Будут найдены документы, содержащие ссылки на определённые URL
#linkl=www.comptek.ru*
найдутся документы, которые сослались на сервер компании
#image="X*"
Будут найдены документы, содержащие ссылки на документы с изображениями Х
#image="tort*"
найдутся ссылки на документы с изображением тортов
возможно, найдётся и портрет черепахи Тортиллы
#hint=(X)
Будут найдены документы, содержащие изображение с подписью Х
#hint=(кино)
документы, содержащие изображение с подписью кино
Таблица. «Оформление запросов в поисковой системе Яндекс» (окончание)
#keywords=(X Y Z)
#abstrakt=(X Y Z)
Будут найдены документы по ключевым словам и аннотациям X Y Z
keywords – краткое описание содержания страницы. Эта служебная информация и она не видима на странице
Х <- Y
Будут найдены документы, содержащие слова Х и Y, при этом будут выданы первыми документы, содержащие слово Y
компьютер <- телефон
первыми будут выданы документы, содержащие слово телефон
Оформление запросов в поисковой системе Апорт [3]
Написано
Результат поиска
Примечания и примеры
идти
Все формы по правилам
русского языка
найдётся идти, идёт, шёл,
шла и т.д.
Регистр(shift)
Если вы набрали слово с большой буквы, будут найдены только слова с большой буквы
красная площадь
слово 1 AND слово 2
слово 1 + слово 2
слово 1 и слово 2
слово 1 & слово 2
Будут найдены документы, в которых есть оба слова
лечебная & физкультура
лечебная и физкультура
лечебная + физкультура
лечебная AND физкультура
слово 1оr слово 2
слово 1│ слово 2
слово 1 или слово 2
Будут найдены документы, содержащие любое из указанных слов или оба слова одновременно
фото | фотография
слово 1 не слово 2
слово 1 not слово 2
слово 1 - слово 2
Будут найдены документы с первым словом, но без второго
рак - гороскоп
рак не гороскоп
рак not гороскоп
” ”
Будут найдены документы с данными словосочетанием или близкое к нему
”яблоки на снегу ”
будут найдены ”яблоки на снегу”, ”яблоки и снег”, ”яблокам под снегом”, ”яблоко снег”
слХ(слова)
сХ(слова)
wX(слова)
[Х, слова]
Будут найдены документы, где между словами стоит не более двух других слов
сл5(папа мама сын)
между словами ”папа”, ”мама” и ”сын” стоит не более двух других слов, т.е. общее число слов во фрагменте не более 5
Таблица «Оформление запросов в поисковой системе Апорт» (продолжение)
url:
url=
Ограничение поиска одним или несколькими серверами, или даже частью сервера
url=www.intel.ru
документы, на сервере www.intel.ru. В случайном порядке
url=www.intel.ru & soft & условия
все документы, сервера www.intel.ru, содержащие слова ”soft” и ”условия”
url=www.intel.ru/soft/*
все документы, на сервере www.intel.ru в каталоге soft и его подкаталогах
url=*.agama.com
все документы, на серверах www.agama.com, russia.agama.com и т.д.
дата:
дата=
date=
date:
Поиск по датам
папа дата=01/01/97-01/02/97
документы, содержащие слово папа, и имеющие дату от 1 января 1997 года до 1 февраля 1997 года
date=01/01/97 папа
документы, содержащие слово папа, и имеющие дату 1 января 1997 года
дата:<01/02/97 папа
дата:-01/02/97 папа
все документы, содержащие слово папа, и имеющие дату не позже 1 февраля 1997 года
title=
t=
title( )
заг=
з=
Поиск в заголовках
title(папа │мама)
будут найдены документы, содержащие в заголовке слово папа или слово мама, или оба одновременно
перед круглыми скоками знак равенства можно опустить
keywords=
kw=
клсл=
кл=
Поиск в поле МЕТА KEYWORDS
kw(папа мама)
будут найдены документы, для которых автор в ключевых словах указал оба слова: папа и мама
Таблица «Оформление запросов в поисковой системе Апорт» (окончание)
alt=
a=
рис=
р=
Поиск в комментариях к картинкам
alt=(Билл Гейтс)
документы, в которых есть картинка с комментарием, содержащим как минимум два слова: Билл и Гейтс
anchor=
Поиск в тексте ссылок
anchor=(ненавижу Интернет)
документы, в тексте ссылок на которые, встречаются оба слова: ненавидеть и Интернет
description=
Поиск в тексте описаний сайтов и в поле DESRIPTION
description=(”уксусная кислота”)
будут найдены корневые документы сайтов, в тексте описаний которых встречается словосочетание уксусная кислота
text=(оглавление или содержание)
x=(оглавление или содержание)
текст=(оглавление или содержание)
т=(оглавление или содержание)
Поиск в обычном тексте.
Будут найдены документы, в которых любое из указанных слов встречается в пределах основного текста документа
текст=(Последний звонок)
*
Произвольное число любых букв
зелен*
найдутся: зеленка, зелень, зеленый, Зеленоград
!слово
Будут найдены документы, содержащие это слово
!Лужкову
Список литературы
1. http://www.rambler.ru/doc
2. http://www.yandex.ru/info/syntax
3. http://www.glossary.ru