Поисковые системы

Автор работы: Пользователь скрыл имя, 27 Апреля 2010 в 18:59, Не определен

Описание работы

Первые поисковые системы появились в сети Интернет более десяти лет назад. Тогда они выполняли лишь одну функцию – поиска ссылок к недавно созданным страницам.
На начальном этапе развития интернета, число пользователей сети было невелико и количество информации относительно небольшим. В подавляющем большинстве случаев пользователями Интернет были сотрудники различных университетов или научных организаций. В то время поиск нужной информации в сети был не столь актуален, как теперь. Сегодня же поисковые системы превратились в многофункциональный сервис. Они позволяют пользователям находить в сети Интернет самую разнообразную информацию, благодаря чему пользуются огромным успехом.

Файлы: 1 файл

Введение.doc

— 262.00 Кб (Скачать файл)

Ищете имена?

Слова с большой и маленькой буквы  считаются разными формами одного слова, поэтому все равно, какой регистр использовать в запросе. Исключением является оператор точной формы. По запросу '!лужков' будут найдены все документы, содержащие эту словоформу в любом регистре, а по запросу '!Лужков' — только документы, в которых имеется форма 'Лужков' с большой буквы. Это полезно, если искомое имя собственное совпадает с распространенным именем нарицательным, например, село !Кошки или !Прост.

Обязательно найдите слово!

Чтобы отобрать документы, где определенное слово присутствует обязательно, поставьте перед ним плюс (без пробела). Поэтому, если вас интересует цитата из «Гамлета», вы можете задать запрос +быть +или +не быть. Маленькая хитрость: тот же результат можно достичь, задав «обязательные» слова в кавычках: "быть или не быть".

Как исключить слово?

Чтобы исключить документы, в которых  встречается определенное слово, поставьте  перед этим словом два символа  тильды или один минус (без пробела). Например, если вам нужно описание Парижа, а не предложения многочисленных турагентств, задайте запрос путеводитель по Парижу ~~агентство ~~тур. Или запрос путеводитель по Парижу -агентство –тур.

Заключение 

 

  Поисковые системы  обычно состоят из трех компонент:

  • агент (паук или кроулер), который перемещается по Сети и собирает информацию;
  • база данных, которая содержит всю информацию, собираемую пауками;
  • поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.

Во время  путешествия по Интернету, вам обязательно  понадобиться помощь поисковой машины. Очень часто приходится искать информацию в сети не зная даже приблизительно адрес страницы, на которой она может располагаться. В таких случаях на помощь приходит поисковая машина.

Поисковые машины - это роботизированные системы. Специальная программа-робот, которую  называют паук или ползун, постоянно обходит Сеть в поисках новой информации, которую она вносит в базу данных. База данных содержит URL-адреса и проиндексированную информацию, связанную с этими адресами.

При поиске в Интернете важны две составляющие – полнота (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно это все называют одним словом – релевантность, то есть соответствие ответа вопросу. Важными показателями являются охват и глубина поисковой машины (насколько велика база данных по документам), скоростью обхода и актуальностью ссылок (скорость обновления информации в этой базе данных), качеством поиска (чем ближе к началу списка оказывается нужный вам документ, тем лучше работает релевантность).

Кроме релевантности, существуют важные пользовательские характеристики: скорость поиска (медленная поисковая машина неэффективна в работе), поисковые возможности (как именно происходит индексация: только по ключевым словам web-страницы или по всему тексту, с учетом морфологии или без него, с поиском по тэгам HTML - заголовкам, ссылкам, подписям к изображениям и др.), а также дополнительные удобства (удобный интерфейс, наличие специальных функций, например, поиск по датам и серверам). Здесь все зависит от того, что вы предпочитаете.

Среди ведущих поисковых машин на данный момент - Яndex, Google,  Rambler, Апорт! и др.

Анализ  поисковых систем Интернет

Исходя  из темы курсовой работы "Сравнительный обзор современных поисковых систем".

Результаты  поиска представлены в следующей  таблице.                                                                                                                                                     

                                                         Таблица 4

  Yandex

страниц

Google

сайтов 

Aport

cайтов/

документов

Rambler

документов

Yahoo

сайтов

MSN

сайтов

Современные поисковые системы 5 000 000 4 730 000 13 054/

65 133

107 045 483 000 591 000
Популярные  поисковые системы 10 000 000 438 000 4 238 /

42 618

54 016 944 000 148 000
Обзор поисковых систем 1 000 000 149 000 7 038/

84 553

13 364 139 000 28 200
Преимущества  и недостатки поисковых систем 53 000 8 620 218/ 298 2 258 11 200 3  230
Сравнительный анализ работы поисковых систем 809 000 71 400 369 / 917 10 069 28 100 13 900
«Идеальная» поисковая система 83 000 9 210 4 458 /

23 838

5 172 9 060 43 600
Рекомендации  по применению поисковых систем 635 000 124 000 926/

1 811

29 147 35 200 72 800
 

Общее заключение о наличии  материалов в Интернет по теме курсовой

Степень актуальности того или иного предмета исследования определяется, главным  образом, исходя из объема существующей по данному вопросу литературы. В  ходе осуществленного поиска в Internet мною было найдено большое количество информации, касающейся классификации, обзора и анализа современных поисковых систем. Исходя из объема представленной литературы как на английском, так и на русском языках, можно сделать вывод, что к настоящему времени  поисковые системы пользуются огромным спросом среди пользователей сети Internet.

Анализ  статистики по таблице 4

По данным, представленным в таблице поиска, можно анализировать эффективность  каждой из представленных семи поисковых  систем с точки зрения количества найденной информации, а именно сайтов, имеющихся в системе по отдельно заданному запросу. Анализ я осуществляла по следующему принципу: Учитывалась особенность поисковых систем по языковой принадлежности,  анализ производился по 6-ти системам. В ходе анализа статистики мною были выявлены следующие закономерности: наибольшее количество сайтов по запросу на русском языке среди русскоязычных систем было выдано поисковыми системами Yandex и Google, при этом показатели Yandex значительно превышают Google, далее в порядке снижения эффективности следуют системы Aport,  Rambler и MSN соответственно Yahoo, как англоязычная система, показала наихудший результат при поиске ключевых слов, заданных на русском языке. Таким образом, лидирующие позиции по показателям количества представленной информации занимают поисковые системы Yandex и Google и Aport.

Анализ  различных поисковых  систем по степени  эффективности  

Лидерами  по показателям качества представленной  информации оказались Yandex, Google и Aport.

Yandex оказался одной  из наиболее эффективных систем  с точки зрения ее релевантности  и соответствия выданных результатов заданному запросу. Хоть страниц было много, но нужная информация находилась на самых первых из них. Мало затраченного времени – необходимые результаты. При этом немаловажную роль сыграла также относительная новизна представленной информации. 

Google выдавал результаты  страниц, на которых не всегда  первое место занимали релевантные  документы. Зато жалоб на разнообразие  просто не было, т.к. в представленном  количестве материала можно было  найти что угодно ( при этом  было потрачено времени в два раза больше, по сравнению с поисками в других поисковых системах).

Система Aport  оказалась менее эффективной, чем вышеназванные из-за ее чрезмерной ориентации на частные случаи, но результаты, которые она выдавала, значительно отличались от  результатов других поисковых систем. Они были единственные в своем роде, не всегда релевантны, но неповторимы.

Rambler, несмотря на  прочно занимаемое четвертое  место в количественном рейтинге, оказался намного менее эффективной  по релевантности системой. Здесь преобладает ориентация на российские источники информации, что снижает ее адекватность в оценке ситуации в других странах. К этой же категории по степени релевантности можно отнести и поисковую систему Google.

Поисковую систему Yahoo можно рассматривать  как наиболее эффективную наравне  с Yandex, но только в англоязычном поиске. На русском языке в данной системе  имеется незначительное количество сайтов и их релевантность минимальна.

Общий анализ ситуации с  поиском и предоставлением  информации в современном Internet

Исходя  из личного опыта постоянного пользователя я должна сказать, что на данный момент в условиях постоянных качественных изменений во всех сферах жизни и постоянном движении человеческой мысли вперед, Internet является наиболее важным и наиболее часто используемым источником информации. Наибольшая полезность глобальной сети состоит в доступности информации любому пользователю и регулярной обновляемости ресурсов, что позволяет постоянно быть в курсе новых событий. 

Информация о работе Поисковые системы