Автор работы: Пользователь скрыл имя, 10 Декабря 2011 в 16:09, контрольная работа
Сегодня пользователь World Wide Web оказывается в той же ситуации, что и читатель крупной библиотеки. Чем больше фонды библиотеки, тем труднее найти именно ту книгу, которая сейчас нужна. Для упрощения поиска в библиотеке существуют каталоги: систематический, алфавитный, предметный и другие. Существуют и специализированные каталоги, например каталоги новых поступлений.
Введение 3
Основы поисковых служб 4
Поисковые каталоги 5
Поисковые указатели 5
Сравнение поисковых каталогов и указателей 9
Заключение 12
Список использованной литературы 13
Содержание
Введение 3
Заключение 12
Список использованной
литературы 13
Введение
Сегодня пользователь World Wide Web оказывается в той же ситуации, что и читатель крупной библиотеки. Чем больше фонды библиотеки, тем труднее найти именно ту книгу, которая сейчас нужна. Для упрощения поиска в библиотеке существуют каталоги: систематический, алфавитный, предметный и другие. Существуют и специализированные каталоги, например каталоги новых поступлений.
Разные типы поисковых систем используют разные способы предоставления пользователю информации о веб-страницах. Оптимальный метод поиска зависит от того, какая именно информация необходима конечному пользователю.
Для поиска информации в Сети используются специальные поисковые службы. Наиболее основными распространенными поисковыми службами являются поисковые каталоги и указатели. Умение пользоваться ими, собственно говоря, и составляет умение пользоваться Интернетом.
Выбор средства поиска зависит от задачи. Есть задачи, для которых подходят крупнейшие поисковые системы, но есть задачи, для которых небольшой список на пару сотен ссылок будет гораздо полезнее. Выше изложенные аргументы подтверждают актуальность выбранной темы.
Целью написания данной контрольной работы является рассмотрение и изучение поисковых каталогов и указателей в сети internet.
В
соответствии с целью контрольной
работы особое внимание было уделено
решению следующих задач сравнению
поисковых каталогов и указателей.
Сегодня пользователь World Wide Web оказывается в той же ситуации, что и читатель крупной библиотеки. Чем больше фонды библиотеки, тем труднее найти именно ту книгу, которая сейчас нужна. Для упрощения поиска в библиотеке существуют каталоги: систематический, алфавитный, предметный и другие. Существуют и специализированные каталоги, например каталоги новых поступлений.
В Сети поиск обеспечивают специальные поисковые службы. Наиболее основными распространенными поисковыми службами являются поисковые каталоги и указатели. Умение пользоваться ими, собственно говоря, и составляет умение пользоваться Интернетом. Все поисковые системы WWW основаны на гиперссылках. Обращаясь к поисковой службе, пользователь формулирует запрос, в котором формально описывает то, что желает найти. Проведя нужные операции, служба формирует Web-документ, состоящий из гиперссылок, ведущих к ресурсам WWW, соответствующий запросу. В дальнейшем пользователь сам выбирает, каким из этих гиперссылок воспользоваться.
Несмотря
на то, что результат всегда един
(клиент получает список рекомендованных
гиперссылок), принцип действия у разных
поисковых служб может быть различным.
Ниже рассмотрены, как классифицируются
поисковые службы по типам предоставляемых
услуг, а также по способам формирования
своих ресурсов. Последнее очень важно
для эффективной работы не только пользователей,
но и Web-мастеров. Пользователи должны
учитывать способ формирования баз данных,
чтобы знать, на что они могут рассчитывать
при поиске информации, а Web-мастера должны
это знать, чтобы добиться наилучшего
представления своих ресурсов в основных
поисковых службах мира.
При работе с поисковым каталогом для получения конкретного списка Web-ресурсов, необходимо на начальной странице этого каталога выбрать интересующую вас тему, затем в рамках этой темы — категорию, потом — подкатегорию и так далее, пока вы не получите список ресурсов, рекомендованных для просмотра. В этом поисковые каталоги похожи на предметные каталоги общественных и научных библиотек. Крупнейшим поисковым каталогом мира сегодня считается поисковая система «Yahoo!» (www.yahoo.com). Она предоставляет примерно 1млн. ссылок к ресурсам Сети, т.е. охватывает лишь тысячную долю всего Web-пространства. В России аналогом такого поискового каталога можно назвать каталог «Атрус» (www.atrus.ru).
Достоинством
поисковых каталогов, как и их недостатком,
является «человеческий фактор». Вся информация,
помещаемая в каталог, просматривается
и отбирается специально подготовленным
штатом редакторов. Такой подход к формированию
каталогов защищает их от информационного
«мусора», страниц-однодневок и обеспечивает
высокую репутацию таких служб, как «Yahoo!»,
хотя совокупный объем ресурсов справочных
каталогов невелик.
Основное отличие поисковых указателей от поисковых каталогов состоит в полной автоматизации всех этапов работ. Количество страниц, среди которых ведут поиски крупнейшие поисковые указатели. Но то, насколько точно выданный список будет соответствовать вашему запросу и, в конечном счете, решению вашей задачи, зависит от особенностей работы того поискового указателя, который вы выбрали.
В своем большинстве современные поисковые системы начинались с разработки, в основном в университетских лабораториях США, специальных экспериментальных программ для мониторинга Сети.
Поисковые
указатели - это большинство поисковых
служб мира. Принцип работы основан
на ключевых словах. Они задаются поисковой
системе пользователем в качестве задания
в специальном поле (строке) поиска. На
рисунке 1 в качестве примера показана
поисковая строка системы Yandex.
Рисунок
1. Поисковая строка Yandex.
Поисковая система находит по своим базам данных (называемым индексами или указателями) адреса веб-ресурсов, в которых присутствуют ключевые слова, и выдает клиенту веб-страницу со ссылками на эти ресурсы. Такая веб-страница называется результирующей (рис 2.).
Рисунок 2. Фрагмент страницы результатов поиска в системе Yandex по запросу "Открытое образование
Также можно ознакомиться с работой поисковых указателей по следующим адресам: www.altavista.com, www.lycos.com, www.google.ru, www.yandex.ru, www.aport.ru и другие.
Работа поисковых указателей происходит в четыре этапа:
1. Сканирование веб-пространства - поисковая система круглосуточно с помощью специальных программ просматривает доступное пространство Web и копирует к себе все встреченные страницы. Сканирование осуществляется с помощью специальных программных средств. Их общее название - поисковые роботы (еще - черви, гусеницы, краулеры). Каждый поисковый указатель имеет свою собственную программу, основанную на патентованном алгоритме. Но общий принцип действия один:
- поисковые роботы начинают просмотр Сети с какого-то заданного адреса;
- копируют найденный документ на сервер своей системы;
- посматривают его, находят в нем все гиперссылки;
- переходят по ним, находят новые документы, копируют их, находят в них гиперссылки. переходят по ним и т.д.;
- периодически роботы возвращаются к ранее просмотренным документам, чтобы отследить изменения. Об изменениях они узнают по размеру и дате создания документа.
2. Индексация ресурсов - обнаруженные поисковыми роботами страницы обрабатываются специальными программными средствами и из них составляется специальная база данных, именуемая указателем.
Цель индексации - получить индексный
файл, с помощью которого запрос
клиента обрабатывается почти
мгновенно. Каждая система
3. Поиск по запросу - поисковый указатель принимает запрос от пользователя в виде ключевых слов и отбирает ссылки на те ресурсы, которые соответствуют запросу. Высокая скорость поиска обеспечивается за счет первых двух этапов своей работы, благодаря которым поисковая машина при обработке запроса пользователя обращается не в Сеть, а в свою базу данных. Количество найденных страниц может быть очень велико, поэтому перед выдачей результатов клиенту происходит ранжирование результатов поиска. То есть система определят ценность каждого из найденных ресурсов и отсортировывает их так, чтобы наиболее ценные располагались в начале списка. Для этого каждому ресурсу дается оценка. На повышение оценки влияют следующие факты:
- если ключевые слова встречаются в заголовке Web-страницы - это значит, что страница действительно посвящена той теме, которую исследует пользователь
- если ключевые слова, обнаруженные в документе, имеют шрифт увеличенного размера - это говорит о том, что они входят в заголовки разделов документов
- если ключевые слова неоднократно повторяются внутри документа (особенно, если в первых 5-8 абзацах текста)
- если ключевые слова входят в так называемый альтернативный текст (тот, который подменяет иллюстрации, если их изображение отключено). Это значит, что пользователь придает им особое значение.
4.
Формирование результирующей страницы
- система формирует динамическую web-страницу
оформленных результатов поиска. Пример
результирующей страницы системы Google приведен на рисунке
3
Рисунок
3.Фрагмент страницы результатов поиска
в системе Google по запросу "Виртуальный
университет"
У каждого из двух основных типов поисковых служб есть достоинства и недостатки. Поисковые каталоги формируются вручную с помощью живых людей. Поэтому, как правило, если мы находим в них нужный нам ресурс, то этот ресурс — один из лучших в Сети. Он не обязательно самый лучший и, может быть, лишь входит в первую двадцатку, но он явно не случаен и может рассматриваться как рекомендованный. Ответственные редакторы поискового каталога, имеющие солидное образование в большинстве областей науки, техники и культуры, не будут включать в свой каталог очевидную ерунду. Поисковые каталоги удобнее и тем, что там не бывает десятков ссылок на один и тот же ресурс, размещенный в разных местах или проиндексированный в разное время. В общем, если надо быстро найти лучший источник по какой-то теме, надо начинать поиск с поискового каталога.
Недостатком поисковых каталогов является их слабое знание о подлинных ресурсах WWW, которое с каждым днем падает в относительном измерении. Как уже говорилось, крупнейший поисковый каталог Yahoo! за шесть лет своей работы довел количество обработанных ресурсов до миллиона, в то время как каждый год появляются сотни миллионов новых Web-страниц.
Поисковые указатели черпают свою исходную информацию от поисковых роботов, день и ночь ползающих по просторам WWW. Процесс сбора информации полностью автоматизирован, поэтому объем проиндексированного пространства намного больше, чем у поисковых каталогов. Сегодня этот показатель превышает 25% общего пространства Сети. С другой стороны, отсутствие человеческого фактора сказывается на качестве того, что можно найти через поисковые указатели. Для робота совершенно все равно, написана ли статья по физике академиком или школьником. При рейтинговании робот может даже поставить страницу школьника выше.
Поэтому
поисковые каталоги лучше использовать
для ознакомительного поиска, когда
тема известна, а предпочтений нет. Поисковый
каталог быстро выведет на Web-узел, на котором
либо найдется то, что нужно, либо обнаружатся
ссылки на другие полезные ресурсы. А поисковые
указатели стоит использовать для более
глубоких или экзотических розысков. Например,
человеку, которому о теории относительности
и так уже все известно, вряд ли поможет
поисковый каталог, имеющий ссылки на
общеизвестные Web-ресурсы. А поисковый
указатель, проиндексировавший 300 миллионов
Web-страниц, может ему предложить какой-то
уникальный отчет о семинаре, проведенном
в университете штата Айдахо или в Новосибирске.
Информация о работе Сравнение поисковых каталогов и указателей