Поисковые системы

Автор работы: Пользователь скрыл имя, 11 Декабря 2014 в 09:44, доклад

Описание работы

На начальном этапе развития интернета, число пользователей сети было невелико и количество информации относительно небольшим. В подавляющем большинстве случаев пользователями Интернет были сотрудники различных университетов или научных организаций. В то время поиск нужной информации в сети был не столь актуален, как теперь. Сегодня же поисковые системы превратились в многофункциональный сервис. Они позволяют пользователям находить в сети Интернет самую разнообразную информацию, благодаря чему пользуются огромным успехом.

Файлы: 1 файл

Поисковые системы.doc

— 263.00 Кб (Скачать файл)

Более продуктивным подходом к решению  этой проблемы является анализ идеальной модели поисковой системы, которой оперируют пользователи. Идеальная модель – это совокупность представлений пользователя о целях, функциях, структуре, способах контроля и управления, возможных действиях с системой, которые определяют его деятельность. Такой подход – от анализа представлений пользователей и построения идеальной модели к проектированию интерфейсов продукта - снижает риск того, что продукт не понравится пользователям, не будет принят и востребован ими.

В идеальной модели должны присутствовать следующие компоненты:

    • Primary nouns (электронное письмо, товар в Интернет-магазине, картинка, доступная для просмотра в Интернете) – это основные элементы, с которыми пользователь производит действия или манипуляции при работе с системой.
    • Сценарий использования - это описание представлений пользователей о взаимодействии с системой, разбитое на элементарные шаги. Сценарий использования иллюстрирует поведение пользователя при решении определенной задачи с помощью поисковой системы.
    • Диаграмма задач является графическим отображением представлений пользователей о перечне решаемых в системе задач.
    • Диаграмма навигации демонстрирует представления пользователей о порядке смены экранов, с которыми они сталкиваются при работе с системой, и содержании этих экранов. Диаграмма построена на основе сценариев использования системы и используется в процессе проектирования интерфейсов.

Для получения  всех данных, необходимых для составления идеальной модели, было проведено интервью небольшого числа пользователей, а затем – Интернет-опрос. Интервью позволило понять, какие вопросы и каким образом нужно задать, чтобы получить полную картину: кто является пользователем поисковой системы, каковы его потребности и задачи, каким образом он привык решать задачи и каким видит путь решения новых, нестандартных задач.

Проанализированные  ответы позволили построить модель идеальной поисковой системы. В результате исследования были получены выводы о том, чего не хватает пользователям в имеющихся поисковых системах, а также того, что не нравится пользователям. Эта информация позволила выделить прототипы, опираясь именно на портрет целевой аудитории, которая будет работать с поисковой системой, учитывая предпочтения пользователей и особенности их работы. Итак, что у нас получилось?

Проблема 1: Оптимизаторы не могут ясно понять, каким должен быть, «хороший» сайт в понимании поисковика и как сделать его таким, чтобы поисковик считал его наиболее релевантным по запросам.

Решение этой проблемы хорошо реализовано в  поисковой системе MSN Search. В системе ранжированием занимается не только поисковик, но ему также помогает человек-редактор. Благодаря этому, при осуществлении поиск по ключевому слову, команда специалистов компании отслеживает наиболее частые запросы, вводимые в поисковую форму, и подбирает сайты, наиболее релевантные тематике запроса, а так же вручную отбирают и классифицируют их, и вносят в определенные рубрики директории. Что, например, в сравнении с самой популярной поисковой системой мира – Google, которая сама определяет релевантность Интернет-страниц (страница, на которую ссылаются чаще, более релевантна и значит более популярна) помогает избежать этой проблемы. 

Проблема 2: Наличие доступных и понятно изложенных правил по специальному синтаксису каждой отдельной поисковой системы. 

Согласно  моему исследованию изложение доступных  и понятно изложенных правил по специальному синтаксису присутствует в следующих  поисковых системах:

  • Яndex;
  • Google;
  • Апорт;

 

 

Проблема 3: Высокий уровень релевантности выдаваемой информации. 

Используя опыт, полученный в ходе выполнения курсовой работы, и опыт использования  поисковых систем в жизни в  целом, представляю список поисковых  систем (начиная с той, у которой более релеванты результаты поставленным запросам), поисковые системы, не соответствующие, по моему мнению, критерию «релевантность выдаваемой информации» не войдут в представленный ниже список:

  • Яndex;
  • Апорт;
  • Google;

 

 

Проблема 4: Спрос на поисковые системы, которые больше напоминают Интернет-портал, где можно завести почтовый ящик, узнавать курс валют и прогноз погоды, читать блоги и форумы. 

Этому критерию пользователей отвечают: 

Поисковые системы

Почтовый ящик

Курс валют

Прогноз погоды

Блоги

Форумы

Яndex

 

Google

   

Rambler

 

Апорт

 

MSN

 
 

Yahoo

       


Получили, что всем необходимым критериям  не соответствует ни одна и рассмотренных  нами поисковых систем. Ближе всего к идеалу находятся поисковые системы Яndex, Rambler, Апорт. За ними следуют Google и MSN, и заключает шестерку ведущих поисковых систем – Yahoo.

Общий вывод: по рассмотренным критериям поисковая система Яndex больше всех приближена к модели «идеальной» поисковой системы. А такие поисковики как Google и Апорт поочерёдно делят то 2, то 3 места. Отметим также, что поисковая система MSN лидирует в системе ранжирования.

Рекомендации  по применению поисковых  систем:

Первый  вопрос, который возникает у начинающего  пользователя Интернета: "Как найти  необходимую мне информацию?" Прежде всего, мы должны отметить, что нет "правильных" или "неправильных" путей поиска в Интернете. Несомненно, одни из них могут потребовать больше времени, чем другие, но в конечном счете предпочтение должно отдаваться тому методу, который кажется наиболее удобным и эффективным конкретному пользователю Интернета.

Представьте себе, что Вам нужно найти потерявшуюся вещь в Вашем доме. Вы можете использовать несколько способов поиска:

1. Планомерно обыскать все шкафы и полки;

2. Искать только там, где, по Вашему мнению, может находиться эта вещь;

3. Спросить родных: маму, детей, жену или мужа о месте, где может находиться искомый предмет или нечто похожее на него.

Конечно, могут быть и другие способы... Но в каждом отдельном случае только один из трех перечисленных методов будет наиболее успешным. Аналогичный принцип применяется при поиске в любой поисковой системе: Вы можете искать в новостях, файлах или во всем Интернете. Вы даже можете искать только на определенном сайте (только в одном шкафу), если Вы знаете, что искомый объект спрятался именно там. Но следует учитывать, что поисковые роботы могут обойти только те места, куда его пускают (заглянуть только в те шкафы, дверцы которых не заперты).

Точно так же, как и дома, в каждом отдельном случае один из способов может оказаться эффективнее другого: в Интернете нужный объект или сайт может найтись вовсе не там, где ожидалось

Начните искать — это легко

Поисковые машины не требуют от вас знания специальных команд для поиска. Достаточно набрать вопрос — так же, как бы вы его задали библиотекарю или всезнайке-эрудиту. Например, где раки зимуют? Ярчайшая звезда северного полушария?

Морфология  учитывается

Независимо  от того, в какой форме вы употребили слово в запросе, поиск учитывает  все его формы по правилам русского языка. Это называется учет морфологии слов. При необходимости вы всегда можете его отключить.

Что такое правильный запрос?

Правильный  запрос состоит из нескольких слов, потому что по одному слову обычно трудно понять, что вы хотите найти. Например, запрос дизайн может означать желание найти информацию о дизайне  интерьера, или о веб-дизайне, а  может — о ландшафтном дизайне. По такому запросу поисковик  найдет страницы обо всех известных ему видах дизайна. Обычно поисковые системы  хорошо понимает запросы из нескольких слов и способны самостоятельно их интерпретировать. Они знают, в каких случаях надо искать страницы, в которых слова запроса расположены рядом, а когда достаточно словам встретиться в одном документе, чтобы страница хорошо соответствовала запросу.

Ищете цитату?

Если  вы хотите найти точную цитату, просто задайте искомую фразу в кавычках: "о закрой свои бледные ноги". По такому запросу будут найдены все страницы, в которых есть нужная вам цитата.

Ищете имена?

Слова с большой и маленькой буквы  считаются разными формами одного слова, поэтому все равно, какой регистр использовать в запросе. Исключением является оператор точной формы. По запросу '!лужков' будут найдены все документы, содержащие эту словоформу в любом регистре, а по запросу '!Лужков' — только документы, в которых имеется форма 'Лужков' с большой буквы. Это полезно, если искомое имя собственное совпадает с распространенным именем нарицательным, например, село !Кошки или !Прост.

Обязательно найдите слово!

Чтобы отобрать документы, где определенное слово присутствует обязательно, поставьте перед ним плюс (без пробела). Поэтому, если вас интересует цитата из «Гамлета», вы можете задать запрос +быть +или +не быть. Маленькая хитрость: тот же результат можно достичь, задав «обязательные» слова в кавычках: "быть или не быть".

Как исключить слово?

Чтобы исключить документы, в которых  встречается определенное слово, поставьте  перед этим словом два символа  тильды или один минус (без пробела). Например, если вам нужно описание Парижа, а не предложения многочисленных турагентств, задайте запрос путеводитель по Парижу ~~агентство ~~тур. Или запрос путеводитель по Парижу -агентство –тур.

Заключение 

 

  Поисковые системы обычно состоят из трех компонент:

  • агент (паук или кроулер), который перемещается по Сети и собирает информацию;
  • база данных, которая содержит всю информацию, собираемую пауками;
  • поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.

Во время  путешествия по Интернету, вам обязательно  понадобиться помощь поисковой машины. Очень часто приходится искать информацию в сети не зная даже приблизительно адрес страницы, на которой она может располагаться. В таких случаях на помощь приходит поисковая машина.

Поисковые машины - это роботизированные системы. Специальная программа-робот, которую  называют паук или ползун, постоянно обходит Сеть в поисках новой информации, которую она вносит в базу данных. База данных содержит URL-адреса и проиндексированную информацию, связанную с этими адресами.

При поиске в Интернете важны две составляющие – полнота (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно это все называют одним словом – релевантность, то есть соответствие ответа вопросу. Важными показателями являются охват и глубина поисковой машины (насколько велика база данных по документам), скоростью обхода и актуальностью ссылок (скорость обновления информации в этой базе данных), качеством поиска (чем ближе к началу списка оказывается нужный вам документ, тем лучше работает релевантность).

Кроме релевантности, существуют важные пользовательские характеристики: скорость поиска (медленная поисковая машина неэффективна в работе), поисковые возможности (как именно происходит индексация: только по ключевым словам web-страницы или по всему тексту, с учетом морфологии или без него, с поиском по тэгам HTML - заголовкам, ссылкам, подписям к изображениям и др.), а также дополнительные удобства (удобный интерфейс, наличие специальных функций, например, поиск по датам и серверам). Здесь все зависит от того, что вы предпочитаете.

Среди ведущих поисковых машин на данный момент - Яndex, Google,  Rambler, Апорт! и др.

Анализ  поисковых систем Интернет

Исходя  из темы курсовой работы "Сравнительный обзор современных поисковых систем".

Результаты  поиска представлены в следующей  таблице.                                                                                                                                                     

                                                        Таблица 4

 

Yandex

страниц

Google

сайтов 

Aport

cайтов/

документов

Rambler

документов

Yahoo

сайтов

MSN

сайтов

Современные поисковые системы

5 000 000

4 730 000

13 054/

65 133

107 045

483 000

591 000

Популярные  поисковые системы

10 000 000

438 000

4 238 /

42 618

54 016

944 000

148 000

Обзор поисковых систем

1 000 000

149 000

7 038/

84 553

13 364

139 000

28 200

Преимущества  и недостатки поисковых систем

53 000

8 620

218/ 298

2 258

11 200

3  230

Сравнительный анализ работы поисковых систем

809 000

71 400

369 / 917

10 069

28 100

13 900

«Идеальная» поисковая система

83 000

9 210

4 458 /

23 838

5 172

9 060

43 600

Рекомендации  по применению поисковых систем

635 000

124 000

926/

1 811

29 147

35 200

72 800


Информация о работе Поисковые системы