Поиск информации в Интернет

Автор работы: Пользователь скрыл имя, 04 Ноября 2010 в 16:26, Не определен

Описание работы

Методическое пособие

Файлы: 1 файл

Информ.doc

— 251.50 Кб (Скачать файл)

           Обратите внимание на знак "-". Это именно минус, а не тире  и не дефис. Знак "-" надо  писать через пробел от предыдущего и слитно с последующим словом, вот так: 'рак -гороскоп'.

           Основные операторы

           Несколько набранных в запросе  слов, разделенных пробелами, означают, что все они должны входить  в одно предложение искомого  документа. Тот же самый эффект произведет употребление символа '&'.

           Например, при запросе 'лечебная физкультура' или 'лечебная & физкультура'), результатом поиска будет список документов, в которых в одном предложении содержатся и слово 'лечебная', и слово 'физкультура'. (Эквивалентно запросу '+лечебная ^физкультура')

           Между словами можно поставить  знак '|', чтобы найти документы,  содержащие любое из этих слов. (Удобно при поиске синонимов).

           Запрос вида 'фото \ фотография \ фотоснимок \ снимок \ фотоизображение' задает поиск документов, содержащих хотя бы одно из перечисленных слов.

           Еще один знак, тильда '-', позволит  найти документы с предложением, содержащим первое слово, но  не содержащим второе.

           По запросу 'банки ~ закон' будут найдены все документы, содержащие слово 'банки', рядом с которым (в пределах предложения) нет слова 'закон'.

           Чтобы подняться на ступеньку  выше, от уровня предложения до  уровня документа, просто удвойте  соответствующий знак. Одинарный  оператор (&, ~) ищет в пределах предложения, двойной (&&, —) - в пределах документа.

           Например, по запросу  'рецепты && (плавленый сыр)' будут найдены документы, в которых есть и слово 'рецепты' и словосочетание '(плавленый сыр)' (причем '(плавленый сыр)' должен быть в одном предложении. А запрос 'руководство Visual С — цена' выдаст все документы со словами 'руководство Visual С, но без слова 'цена' Поиск с расстоянием

           Часто в запросах ищут устойчивые  словосочетания. Если поставить  их в кавычки, то будут найдены те документы, в которых эти слова идут строго подряд.

           Например, по запросу "красная шапочка" будут найдены документы с этой фразой. (При этом контекст "а шапочка у нее была красная" найден не будет.)

           Как Япйех адресует слова? Если все слова в тексте перенумеровать по порядку их следования, то расстояние между словами а и b - это разница между номерами слов а и Ь. Таким образом, расстояние между соседними словами равно 1 (а не 0), а расстояние между соседними словами, стоящими "не в том порядке", равно -1. То же самое относится и к предложениям.

           Если между двумя словами поставлен  знак '/', за которым сразу напечатано  число, значит, требуется, чтобы  расстояние между ними не превышало  этого числа слов.

           Например, задав запрос 'поставщики /2 кофе', вы требуете найти документы, в которых содержатся и слово 'поставщики' и слово 'кофе', причем расстояние между ними должно быть не более двух слов и они должны находиться в одном предложении. (Найдутся "поставщики колумбийского кофе", "поставщики кофе из Колумбии" и т.д.)

           В общем виде ограничение по  расстоянию задается при помощи  пунктуации вида 7(n m)', где 'n' минимальное,  а 'm' максимально допустимое расстояние. Отсюда следует, что запись  ‘/n’ эквивалентна ‘/(-n +n)’, а запись ‘/+n’ эквивалентна ‘/(+n +n)'.

           Запрос 'музыкальное/(-2 4) образование' означает, что 'музыкальное' должна находиться от 'образование' в интервале расстояний от 2 слов слева до 4 слов справа.

           Практически все знаки можно комбинировать с ограничением расстояния.

           Например, результатом  поиска по запросу  'вакансии ~/+1 студентов' будут документы, содержащие слово 'вакансии', причем в этих документах слово 'студентов' не следует непосредственно за словом 'вакансии'. Скобки

           Вместо одного слова в запросе  можно подставить целое выражение.  Для этого его надо взять  в скобки.

           Например, запрос '(история \ технология \ изготовление) /+1 (сыра \ творога)' задает поиск документов, которые содержат любую из фраз 'история сыра', 'технология творога', 'изготовление сыра', 'история творога'.

           Поиск в зонах

           Можно искать информацию в  "зонах" - заголовках (имя "зоны": Title), ссылках (имя "зоны": Anchor) и адресе (имя "зоны": Address). Синтаксис: $имя_зоны (поисковое выражение).

           Запрос '$title CompTek' ищет в заголовках документов слово 'CompTek'. Запрос 'Sanchor (CompTek \ Dialogic)' находит документы, в ссылках внутри которых есть одно из слов 'CompTek' или 'Dialogic'. Поиск в определенных элементах

           Можно ограничить поиск информации  списком серверов или наоборот  исключить сервера из поиска (url). Можно также искать документы,  содержащие ссылки на определенные URL (link), и файлы картинок (image). Если  вы хотите работать не с конкретным URL (image), а со всеми, начинающимися с данной последовательности символов, используйте "*". Синтаксис: #имя_элемента="имя_файла (URL)".

           По запросу 'CompTek — #url="www.comptek.ru*"' будут искаться упоминания компании 'CompTek' везде, кроме ее собственного сервера (www.comptek.ru). А запрос '#link=" www.comptek.ru*"' покажет все документы, которые сослались на сервер компании. Запрос ' #image="tort*"' даст ссылки на документы с изображениями тортов (хотя, возможно, найдется и портрет черепахи Тортиллы)

           Можно также искать по ключевым  словам (keywords), аннотациям(abstract) и подписям  под изображениями (hint). Синтаксис:  #имя элемента=(поисковое выражение).

           Запросу '#keywords=(noucковая система) | #abstract=(noucковая система)' будут искаться все страницы, в meta тегах которых есть эти слова.

           По запросу '#hint=(кино)' будут найдены документы, содержащие изображение с такой подписью.

 

Синтаксис языка запросов (строгий  поиск) Яндекс

          

Синтаксис Что означает оператор Пример  запроса
пробел или

&

      логическое И (в пределах предложения)   лечебная  физкультура
&& логическое  И (в пределах документа) рецепты && (плавленый сыр)
1 логическое  ИЛИ фото | фотография снимок | фотоизображение
+ обязательное  наличие слова в найденном  документе (работает также в применении к стоп-словам) +быть или  +не быть
О группирование слов (технология | изготовление) (сыра | творога)
~ бинарный оператор И НЕ (в пределах предложения) банки ~ закон
~~ бинарный оператор И НЕ (в пределах документа) путеводитель  по парижу — (агентство | тур)
/(nm) расстояние  в словах (-назад +вперед) поставщики /2 кофе музыкальное /(-2 4) образование вакансии ~ /+1 студентов
" " поиск фразы "красная  шапочка" (эквивалентно красная /+1 шапочка)
&&/( nm) расстояние  в предложениях (-назад +вперед) банк && /1 налоги
 

Поиск в элементах

Синтаксис ЧТО означает оператор Пример запроса
$title (выражение) поиск в заголовке Stitle (CompTek)
$anchor (выражение) поиск в тексте ссылок Sanchor (CompTek | Dialogic)
#кеуwords = (выражение) поиск в ключевых словах #keywords=( поисковая  система)
#аbstract = (выражение) поиск в описании #abstract=(HCKanKa | поиск)
#image = "значение" поиск файла  изображения #image="tort*"
#hint=(выражение) поиск в подписях к изображениям #hint=(lenin ленин)
#url="значение" поиск на заданном сайте (странице) #url="www.comptek.ru*"
#link="значение" поиск ссылок на заданный URL #link="www. yandex.ru*"
#mime="значение" поиск в документах данного (pdf или rtf) типа #mime="pdf"

Справочник  по языку запросов системы АПОРТ

           Примеры простых запросов

           Обычно запрос представляет из  себя просто одно или несколько  слов, например:

           микропроцессоры компании Intel

           По такому запросу находятся документы, в которых встречаются все слова запроса. Есть, правда, ограниченное число слов (союзы, предлоги и т.п.), которые в запросе игнорируются, так как не несут сами по себе смысловой нагрузки. Например, по запросу:

           яблоки на снегу

           будут найдены все документы,  в которых встречаются одновременно  два слова: "яблоко" и "снег". Где в пределах документа расположены  слова, в какой грамматической  форме они находятся — не  важно.

           Стоит еще раз подчеркнуть  важное и очень полезное свойство Апорта: независимо от того, в какой грамматической форме вы пишите в запросе слово, оно находится в документах во всех своих формах. Например, по запросу:

           человек шел

           будут найдены среди прочих  и документы, содержащие текст "люди идут". Распознавание всех форм работает для обычных слов русского языка. Для экзотических слов, неологизмов и т.п. оно не проходит. В этом случае может пригодиться оператор "*" (звездочка). Поиск по адресам (по URL)

           Вы можете искать документы не только по всему русскоязычному Интернету, но и по его части. Самый простой случай — поиск по определенному серверу. Например:

           url=www.intel.ru собака

           По данному запросу будут найдены  все документы на сервере www.intel.ru, содержащие слово "собака". Возможно, вам интересно, а что будет, если написать просто:

           url=www. Mel. ru

           В этом случае вы получите  список всех документов, расположенных  на указанном вами сервере.

           Вы можете ограничивать поиск и сильнее — одним из каталогов сервера. Например:

           url=www. Intel, ru/sobaki/ сенбернар

           По данному запросу документы,  содержащие слово "сенбернар", будут искаться только в каталоге /sobaki (и его подкаталогах) московского сервера корпорации Intel.

 

Справочник  по языку запросов

ОПЕРАТОР СИНОНИМЫ ОПИСАНИЕ
И AND

&

Оператор логическое И подразумевается, его можно  опускать: запрос быстрый поиск полностью
  + эквивалентен  запросу быстрый и поиск. По любому из этих запросов будут найдены документы, содержащие оба слова.
ИЛИ OR

1

Оператор логическое ИЛИ позволяет искать документы, содержащие хотя бы один из операндов. По запросу быстрый или поиск будут найдены документы, содержащие любое из указанных слов или оба слова одновременно.
НЕ NOT Оператор логическое НЕ ограничивает поиск документами, не содержащими слово, указанное  после оператора. По запросу фрукты не яблоки будут найдены документы, содержащие слово "фрукты", но не содержащие слово "яблоки".
()   Круглые скобки задают порядок действия логических операторов. По запросу быстрый или качественный поиск будут выданы документы, содержащие либо слово "быстрый", либо одновременно слова "качественный" и "поиск"(оператор и действует первым). По запросу (быстрый или качественный) поиск будут выданы документы, где встречаются одновременно слова "быстрый""поиск", либо "качественный" и "поиск".
" " ‘ ‘ Двойные или  одинарные кавычки позволяют  находить словосочетание, указанное  в них, или близкое к нему. Последняя  оговорка связана с двумя обстоятельствами. Во-первых, стоп-слова в кавычках игнорируются, как и в обычном запросе. Во-вторых, грамматическая форма слов также кавычками не фиксируется. Пример: по запросу "яблоки на снегу" будут найдены документы, содержащие следующие фрагменты: "яблоки на снегу", "яблоки и снег", "яблокам под снегом", "яблоко снег" и т.п.
сл2(...) с2(...)

w2(...)

[2,-.]

Ограничение расстояния в словах (двойка указана как пример). Если вы хотите потребовать, чтобы заданные вами слова встречались, скажем, в пределах 5 слов, то надо написать: сл5(папа мама сын). При этом будут найдены документы, где между словами "папа", "мама" и "сын" стоит не более двух других слов (то есть общее число слов во фрагменте не более 5). Порядок, в котором встречаются заданные слова не важен.
*   Звездочка в  конце слова символизирует, как  это принято, произвольное число  любых букв. По запросу зелен* будут  найдены документы,

содержащие любое  из слов зеленка, зелень, зеленый, Зеленоград в любой грамматической форме.

!   Указание нормальной формы (знак ставится в начале слова). Иногда некоторые формы разных слов совпадают. Например, слово "пар" — это нормальная форма существительного мужского рода и родительный падеж слова "пара" (в смысле двойка). Чтобы снять подобную неоднозначность, вы можете указать в запросе слово с восклицательным знаком спереди, чтобы подчеркнуть, что это нормальная форма, и отсечь хотя бы часть ненужных словоформ и как-то ограничить выдачу. Так по запросу "!пар" не будет находиться словоформа "парой", имеющаяся только у существительного женского рода "пара".

Информация о работе Поиск информации в Интернет