Автор работы: Пользователь скрыл имя, 13 Сентября 2009 в 14:54, Не определен
В данной работе описана история развития и структура ПС, произведён сравнительный обзор и классификация таких поисковых систем как Google, Yandex, Rambler, Aport, MSN search, Yahoo и многие другие. Выделены преимущества и недостатки, произведён анализ работы и построена модель "идеальной" ПС
Первый
вопрос, который возникает у
Представьте
себе, что Вам нужно найти
1. Планомерно обыскать все шкафы и полки;
2. Искать только там, где, по Вашему мнению, может находиться эта вещь;
3. Спросить родных: маму, детей, жену или мужа о месте, где может находиться искомый предмет или нечто похожее на него.
Конечно, могут быть и другие способы... Но в каждом отдельном случае только один из трех перечисленных методов будет наиболее успешным. Аналогичный принцип применяется при поиске в любой поисковой системе: Вы можете искать в новостях, файлах или во всем Интернете. Вы даже можете искать только на определенном сайте (только в одном шкафу), если Вы знаете, что искомый объект спрятался именно там. Но следует учитывать, что поисковые роботы могут обойти только те места, куда его пускают (заглянуть только в те шкафы, дверцы которых не заперты).
Точно так же, как и дома, в каждом отдельном случае один из способов может оказаться эффективнее другого: в Интернете нужный объект или сайт может найтись вовсе не там, где ожидалось
Начните искать — это легко
Поисковые машины не требуют от вас знания специальных команд для поиска. Достаточно набрать вопрос — так же, как бы вы его задали библиотекарю или всезнайке-эрудиту. Например, где раки зимуют? Ярчайшая звезда северного полушария?
Морфология учитывается
Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Это называется учет морфологии слов. При необходимости вы всегда можете его отключить.
Что такое правильный запрос?
Правильный запрос состоит из нескольких слов, потому что по одному слову обычно трудно понять, что вы хотите найти. Например, запрос дизайн может означать желание найти информацию о дизайне интерьера, или о веб-дизайне, а может — о ландшафтном дизайне. По такому запросу поисковик найдет страницы обо всех известных ему видах дизайна. Обычно поисковые системы хорошо понимает запросы из нескольких слов и способны самостоятельно их интерпретировать. Они знают, в каких случаях надо искать страницы, в которых слова запроса расположены рядом, а когда достаточно словам встретиться в одном документе, чтобы страница хорошо соответствовала запросу.
Ищете цитату?
Если вы хотите найти точную цитату, просто задайте искомую фразу в кавычках: "о закрой свои бледные ноги". По такому запросу будут найдены все страницы, в которых есть нужная вам цитата.
Ищете имена?
Слова
с большой и маленькой буквы
считаются разными формами
Обязательно найдите слово!
Чтобы отобрать документы, где определенное слово присутствует обязательно, поставьте перед ним плюс (без пробела). Поэтому, если вас интересует цитата из «Гамлета», вы можете задать запрос +быть +или +не быть. Маленькая хитрость: тот же результат можно достичь, задав «обязательные» слова в кавычках: "быть или не быть".
Как исключить слово?
Чтобы исключить документы, в которых встречается определенное слово, поставьте перед этим словом два символа тильды или один минус (без пробела). Например, если вам нужно описание Парижа, а не предложения многочисленных турагентств, задайте запрос путеводитель по Парижу ~~агентство ~~тур. Или запрос путеводитель по Парижу -агентство –тур.
Поисковые системы обычно состоят из трех компонент:
Во время путешествия по Интернету, вам обязательно понадобиться помощь поисковой машины. Очень часто приходится искать информацию в сети не зная даже приблизительно адрес страницы, на которой она может располагаться. В таких случаях на помощь приходит поисковая машина.
Поисковые машины - это роботизированные системы. Специальная программа-робот, которую называют паук или ползун, постоянно обходит Сеть в поисках новой информации, которую она вносит в базу данных. База данных содержит URL-адреса и проиндексированную информацию, связанную с этими адресами.
При поиске
в Интернете важны две
Кроме релевантности, существуют важные пользовательские характеристики: скорость поиска (медленная поисковая машина неэффективна в работе), поисковые возможности (как именно происходит индексация: только по ключевым словам web-страницы или по всему тексту, с учетом морфологии или без него, с поиском по тэгам HTML - заголовкам, ссылкам, подписям к изображениям и др.), а также дополнительные удобства (удобный интерфейс, наличие специальных функций, например, поиск по датам и серверам). Здесь все зависит от того, что вы предпочитаете.
Среди ведущих поисковых машин на данный момент - Яndex, Google, Rambler, Апорт! и др.
Анализ поисковых систем Интернет
Исходя из темы курсовой работы "Сравнительный обзор современных поисковых систем".
Результаты
поиска представлены в следующей
таблице.
|
Общее заключение о наличии материалов в Интернет по теме курсовой
Степень актуальности того или иного предмета исследования определяется, главным образом, исходя из объема существующей по данному вопросу литературы. В ходе осуществленного поиска в Internet мною было найдено большое количество информации, касающейся классификации, обзора и анализа современных поисковых систем. Исходя из объема представленной литературы как на английском, так и на русском языках, можно сделать вывод, что к настоящему времени поисковые системы пользуются огромным спросом среди пользователей сети Internet.
Анализ статистики по таблице 4
По данным,
представленным в таблице поиска,
можно анализировать
Анализ различных поисковых систем по степени эффективности
Лидерами
по показателям качества
Yandex оказался одной из наиболее эффективных систем с точки зрения ее релевантности и соответствия выданных результатов заданному запросу. Хоть страниц было много, но нужная информация находилась на самых первых из них. Мало затраченного времени – необходимые результаты. При этом немаловажную роль сыграла также относительная новизна представленной информации.
Google выдавал результаты страниц, на которых не всегда первое место занимали релевантные документы. Зато жалоб на разнообразие просто не было, т.к. в представленном количестве материала можно было найти что угодно ( при этом было потрачено времени в два раза больше, по сравнению с поисками в других поисковых системах).
Информация о работе Сравнительный обзор современных поисковых систем