Сравнительный обзор современных поисковых систем

Автор работы: Пользователь скрыл имя, 13 Сентября 2009 в 14:54, Не определен

Описание работы

В данной работе описана история развития и структура ПС, произведён сравнительный обзор и классификация таких поисковых систем как Google, Yandex, Rambler, Aport, MSN search, Yahoo и многие другие. Выделены преимущества и недостатки, произведён анализ работы и построена модель "идеальной" ПС

Файлы: 1 файл

Сравнительный обзор современных поисковых систем.doc

— 1.65 Мб (Скачать файл)

Сравнительный анализ работы различных  поисковых систем: 

  1. Сформулировала  тему поиска.
  2. Создала  поисковый запрос (одинаковый для всех поисковых систем).
  3. Результаты поиска (количество ссылок) поместила в таблицу.
  4. По результатам поиска создала  уточняющие поисковые запросы (с учетом правил работы в конкретной поисковой системе), чтобы уменьшить количество нерелевантных ссылок. Уточняющие запросы создавала  до тех пор, пока результаты поиска станет возможно проанализировать – 10 ссылок.
  5. Результаты уточняющего поиска (количество ссылок) поместила в таблицу.
  6. Проанализировала 10 первых найденных ссылок на предмет релевантности.
  7. Сделала  вывод о качестве поиска каждой поисковой системой и поставила оценки по пятибалльной шкале.
 
 

   Таблица 3

  Что такое тезаурус и  каковы правила его  создания?
Поисковые системы Яndex 
(стр.)
Rambler 
(док-ов)
Google 
(сайтов)
Aport 
(сайтов)
MSN 
(сайтов)
Yahoo! 
(сайтов)
Поисковый Запрос 75.000 2.676 24.600 1.946 9.770 16.800
Уточняющий 
Запрос
7.453 189 20.400 443 543 417
Анализ  первых 10 найденных ссылок Нет ничего 

 
Нужная ссылка оказалась на 2 странице под номером 13

Ничего нет 

Нужная ссылка оказалась на 5 странице

Ничего нет 

 
После просмотра 10 страниц = 100 ссылкам – ничего не найдено

Нужная ссылка на первой странице под номером 10 Ничего нет 

 
Нужная ссылка оказалась на 3 странице

Ничего нет 

Нужная ссылка оказалась на 2 странице под номером 16

Кол-во релевантных ссылок  
0
 
0
 
0
 
1
 
0
 
0
Вывод-Оценка по пятибалльной шкале  
5
 
4
 
2
 
5
 
4
 
4

Модель "идеальной" поисковой системы

Поисковые системы являются инструментом, которым  сегодня пользуется большинство  посетителей Интернета. Современные  поисковые системы начинают тяготеть к порталам, расширяя предлагаемые возможности и не ограничивая  пользователей только поиском.

Поисковики – это своего рода монополисты. Они ведут скрытую политику, диктуют свои правила, не разглашая их при этом. А подчас, даже просто беспредельничают и показывают поразительную необъективность по отношению к сайтам. Возникает ситуация, что оптимизаторы не могут ясно понять, каким он должен быть, «хороший» сайт в понимании поисковика. Как сделать его таким, чтобы поисковик считал его наиболее релевантным по запросам. И именно из-за этой неопределённости и возникают у вэб-мастеров желание обхитрить систем.

Выход из этой проблемы – создание полностью  ОТКРЫТОЙ поисковой системы, в которой  бы ранжированием занимался не только поисковик но и сами веб-мастера. Чтобы в ней возможно было открыть все механизмы и алгоритмы ранжирования и при этом объективно оценивать сайты между собой.

Главный недостаток современных поисковых систем – это их централизация. А централизация означает, что вся информация хранится в одном месте, все работы и расчёты производятся в одном месте, все решения (результаты выдачи) принимаются в одном месте.

Итак, почему это недостаток, здесь несколько  причин:

1) Полная  централизация требует колоссальных  ресурсов – это огромные базы  данных, множество компьютеров и  т.д. Учитывая темпы роста Интернета  в ближайшем будущем придется применять просто невероятные мощности.

2) Только  при управлении в одном центре  можно достичь полной конфидициальности.  А так как по нашей концепции  поисковая система должна быть  открытой, то и необходимость в централизации отпадает полностью.

3) Поисковая  система не всегда может правильно  оценить конкретный ресурс. Правильнее самому обладателю сайта поручить выполнение ранжирования документов внутри сайта. И теперь, самое главное как уйти от централизации и устранить все эти минусы - это внедрение в каждый сайт своей минипоисковой системы. Эта минипоисковая система будет индексировать содержимое сайта по правилам самого обладателя сайта. Только вэбмастер будет решать, какие страницы его сайта по каким запросам более релевантны. А потом свои индексы уже будет отправлять на сервер поисковой системы.

Ещё одной  из основных проблем при создании новой поисковой системы является учет мнения пользователей.

Попытка непосредственного выявления представлений  пользователей об идеальной поисковой  системе обычно не приводит к нужному результату: пользователи перечисляют все, что когда-либо видели или использовали в существующих системах. Не стоит ждать от пользователей навыков проектирования – они вряд ли смогут быстро описать, как должна выглядеть идеальная поисковая система.

Более продуктивным подходом к решению  этой проблемы является анализ идеальной модели поисковой системы, которой оперируют пользователи. Идеальная модель – это совокупность представлений пользователя о целях, функциях, структуре, способах контроля и управления, возможных действиях с системой, которые определяют его деятельность. Такой подход – от анализа представлений пользователей и построения идеальной модели к проектированию интерфейсов продукта - снижает риск того, что продукт не понравится пользователям, не будет принят и востребован ими.

В идеальной модели должны присутствовать следующие компоненты:

    • Primary nouns (электронное письмо, товар в Интернет-магазине, картинка, доступная для просмотра в Интернете) – это основные элементы, с которыми пользователь производит действия или манипуляции при работе с системой.
    • Сценарий использования - это описание представлений пользователей о взаимодействии с системой, разбитое на элементарные шаги. Сценарий использования иллюстрирует поведение пользователя при решении определенной задачи с помощью поисковой системы.
    • Диаграмма задач является графическим отображением представлений пользователей о перечне решаемых в системе задач.
    • Диаграмма навигации демонстрирует представления пользователей о порядке смены экранов, с которыми они сталкиваются при работе с системой, и содержании этих экранов. Диаграмма построена на основе сценариев использования системы и используется в процессе проектирования интерфейсов.

Для получения  всех данных, необходимых для составления идеальной модели, было проведено интервью небольшого числа пользователей, а затем – Интернет-опрос. Интервью позволило понять, какие вопросы и каким образом нужно задать, чтобы получить полную картину: кто является пользователем поисковой системы, каковы его потребности и задачи, каким образом он привык решать задачи и каким видит путь решения новых, нестандартных задач.

Проанализированные  ответы позволили построить модель идеальной поисковой системы. В результате исследования были получены выводы о том, чего не хватает пользователям в имеющихся поисковых системах, а также того, что не нравится пользователям. Эта информация позволила выделить прототипы, опираясь именно на портрет целевой аудитории, которая будет работать с поисковой системой, учитывая предпочтения пользователей и особенности их работы. Итак, что у нас получилось?

Проблема 1: Оптимизаторы не могут ясно понять, каким должен быть, «хороший» сайт в понимании поисковика и как сделать его таким, чтобы поисковик считал его наиболее релевантным по запросам.

Решение этой проблемы хорошо реализовано в  поисковой системе MSN Search. В системе ранжированием занимается не только поисковик, но ему также помогает человек-редактор. Благодаря этому, при осуществлении поиск по ключевому слову, команда специалистов компании отслеживает наиболее частые запросы, вводимые в поисковую форму, и подбирает сайты, наиболее релевантные тематике запроса, а так же вручную отбирают и классифицируют их, и вносят в определенные рубрики директории. Что, например, в сравнении с самой популярной поисковой системой мира – Google, которая сама определяет релевантность Интернет-страниц (страница, на которую ссылаются чаще, более релевантна и значит более популярна) помогает избежать этой проблемы. 

Проблема 2: Наличие доступных и понятно изложенных правил по специальному синтаксису каждой отдельной поисковой системы. 

Согласно  моему исследованию изложение доступных  и понятно изложенных правил по специальному синтаксису присутствует в следующих  поисковых системах:

  • Яndex;
  • Google;
  • Апорт;
 

Проблема 3: Высокий уровень релевантности выдаваемой информации. 

Используя опыт, полученный в ходе выполнения курсовой работы, и опыт использования  поисковых систем в жизни в  целом, представляю список поисковых  систем (начиная с той, у которой более релеванты результаты поставленным запросам), поисковые системы, не соответствующие, по моему мнению, критерию «релевантность выдаваемой информации» не войдут в представленный ниже список:

  • Яndex;
  • Апорт;
  • Google;
 

Проблема 4: Спрос на поисковые системы, которые больше напоминают Интернет-портал, где можно завести почтовый ящик, узнавать курс валют и прогноз погоды, читать блоги и форумы. 

Этому критерию пользователей отвечают: 

Поисковые системы Почтовый ящик Курс валют Прогноз погоды Блоги Форумы
Яndex
 
Google
   
Rambler
 
Апорт
 
MSN
 
 
Yahoo
       

Получили, что всем необходимым критериям  не соответствует ни одна и рассмотренных  нами поисковых систем. Ближе всего к идеалу находятся поисковые системы Яndex, Rambler, Апорт. За ними следуют Google и MSN, и заключает шестерку ведущих поисковых систем – Yahoo.

Общий вывод: по рассмотренным критериям поисковая система Яndex больше всех приближена к модели «идеальной» поисковой системы. А такие поисковики как Google и Апорт поочерёдно делят то 2, то 3 места. Отметим также, что поисковая система MSN лидирует в системе ранжирования.

Информация о работе Сравнительный обзор современных поисковых систем