Автор работы: Пользователь скрыл имя, 13 Декабря 2017 в 20:33, статья
В мире написаны сотни поисковых систем, а если считать функции поиска, реализованные в самых разных программах, то счет надо вести на тысячи. И как бы ни был реализован процесс поиска, на какой бы математической модели он не основывался, идеи и программы, реализующих поиск, достаточно просты. Так или иначе, но именно поисковые системы стали одним из двух новых чудес света, предоставив Homo Sapiens неограниченный и мгновенный доступ к информации. Первым чудом, очевидно, можно считать Интернет как таковой, с его возможностями всеобщей коммуникации.
УДК 004.912
Раецкая О.В., Кутузов Е.Е.
Филиал федерального государственного казенного военного образовательного
учреждения высшего образования «Военный учебно-научный центр Военно
-воздушных сил «Военно-
ЗНАЧИМЫЕ ПОИСКОВЫЕ СИСТЕМЫ ИНТЕРНЕТА
Аннотация. В статье рассказывается про поисковые системы в основе которых лежит автоматический сбор информации.
Ключевые слова: информация, поиск, поисковые системы, поисковый запрос.
В мире написаны сотни поисковых систем, а если считать функции поиска, реализованные в самых разных программах, то счет надо вести на тысячи. И как бы ни был реализован процесс поиска, на какой бы математической модели он не основывался, идеи и программы, реализующих поиск, достаточно просты. Так или иначе, но именно поисковые системы стали одним из двух новых чудес света, предоставив Homo Sapiens неограниченный и мгновенный доступ к информации. Первым чудом, очевидно, можно считать Интернет как таковой, с его возможностями всеобщей коммуникации.
Как и любая программа, поисковая система оперирует со структурами данных и исполняет алгоритм. Разнообразие алгоритмов не очень велико, но оно есть. Три алгоритма из четырех требуют «индексирования», предварительной обработки документов, при котором создаются вспомогательный файл, сиречь «индекс», призванный упростить и ускорить сам поиск. Это алгоритмы инвертированных файлов, суффиксных деревьев, сигнатур. В вырожденном случае предварительный этап индексирования отсутствует, а поиск происходит при помощи последовательного просмотра документов.
Все поисковые системы объединяет то, что они расположены на специально-выделенных мощных серверах и привязаны к эффективным каналам связи. Поисковые системы называют еще информационно-поисковыми системами (ИПС). Самые известные обслуживают в сутки миллионы клиентов. В случаях, когда поисковая система имеет в своей основе каталог, она называется каталогом. В ее основе лежит работа модераторов. В основе же ИПС с полнотекстовым поиском лежит автоматический сбор информации. Он осуществляется специальными программами. Эти программы периодически исследуют содержимое всех ресурсов Интернета. Для этого они перемещаются, или как говорят, ползают, по разным ресурсам. Соответственно такие программы называются роботы. Есть и другие названия: поскольку WWW – это аббревиатура выражения Всемирная паутина, то такую программу естественно назвать спайдером по англ. – паук. В последнее время используются другие названия: автоматические индексы или директории. Все эти программы исследуют и «скачивают» информацию с разных URL-адресов. Программы указанного типа посещают каждый ресурс через определенное время. Ни одна поисковая система не в состоянии проиндексировать весь Интернет. Поэтому БД, в которых собраны адреса проиндексированных ресурсов, у разных поисковых систем разные. Тем не менее, многие из них стремятся, по возможности, охватывать в своей работе все пространство мировой Сети. Это универсальные системы.
Мощные поисковые системы универсального типа созданы для работы на всех основных языках мира. Каждая страна старается создать хотя бы одну собственную поисковую систему. Познакомимся с основными отечественными и зарубежными поисковыми системами.
Поиск информации является одной из составляющих человеческой деятельности. В Интернете ежедневно появляется и исчезает огромное количество ресурсов. Необходимо уметь в них ориентироваться. Чтобы эффективно выполнить поиск, нужно умело составить запрос к поисковой системе.
Если ответ ищется в каталоге, то особых сложностей при работе здесь нет. Создатели каталога и модераторы озаботились созданием разделов каталога. Пользователь должен только четко определиться с предметом поиска и затем воспользоваться структурой, которая ему предложена.
Таблица 1
Поисковые системы Интернета
www.yandex.ru |
"Яндекс" - поисковая система по русскому интернету |
Учёт русской морфологии. Подсветка найденных документов, показ контекстов. Параллельный поиск в "Энциклопедиях", "Новостях", "Маркете". Структурирование поиска по разделам каталога и серверам. |
Цитируемость: 39000 |
Регион: Россия |
www.rambler.ru |
"Рамблер" - информационно-поисковая система |
Первая российская поисковая система. Имеет возможность учета морфологии русского языка. |
Цитируемость: 16000 |
Регион: Россия |
www.google.ru - |
"Google" - поисковая система |
Система поиска информации в сети интернет (включая русскоязычный интернет). Возможность поиска картинок и новостей в конференциях Usenet. |
Цитируемость: 11000 |
|
www.yahoo.com |
"Yahoo!" - поисковая система |
Возможен поиск на русском языке. |
Цитируемость: 5300 |
|
www.filesearch.ru - |
Русский FTP-Search |
Файловая поисковая система. Top 100 крупнейших FTP-серверов в России. |
Цитируемость: 4000 |
Регион: Россия |
www.meta.ua |
"Мета-Украина" - украинская поисковая система |
Учёт морфологии украинского и русского языков. Выделение контекстов найденных слов. Перевод запросов и результатов на русский, украинский и английский языки. |
Цитируемость: 4700 |
Регион: Украина |
www.sites.ru |
"Sites.ru" - лица российских сайтов |
Иллюстрированный поисковый каталог сайтов |
Цитируемость: 275 |
В основе полнотекстового поиска лежит умение удачно составить поисковый запрос. При прочих равных условиях следует выбирать для поиска наиболее суженное, мало распространенное слово. В то же время может случиться и так, что поиск по слишком узкому термину не дает результатов. Тогда надо переходить к более широким терминам.
Интернет прочно вошел в жизнь практически каждого современного человека. Людям уже сложно представить, как можно было раньше обходиться без этого гигантского хранилища информации, в котором можно почерпнуть столько полезного и занимательного. Глобальная сеть стала не только местом, где можно найти ответы на все вопросы, но также способом общения, взаимодействия с другими людьми. С помощью компьютерной сети каждый человек сегодня может получить образование, найти работу, наладить личную жизнь, в общем, стать полноценным членом общества.
Согласно данным, представленным на веб-ресурсе gs.seo-auditor.
Отчет о динамике изменения популярности поисковых систем за 2017 года показывает что Яндекс немного уступил Google в разницу 0,89%. За лидерами выстроились менее востребованные поисковики, а именно: Mail.ru — 3,45%;Рамблер — 0,52%; Bing — 0,32%; Yahoo! — 0,26%; QIP — 0,06%; Nigma — 0,04%; Ask — 0,03%.
По данным сайта www.smartinsights.com, согласно чистой рыночной доле (по состоянию на апрель 2017 года) доля глобального маркетинга с точки зрения использования Google составляет более 77%. Это еще раз подтверждает тот факт, что Google является лидером на рынке, но также подчеркивается, что другие, такие как Yahoo, Bing, Baidu и т. д. не стоит игнорировать. Интересно отметить, что значительная доля рынка Google по-прежнему растет.
Количество людей, использующих поисковые системы, растет с каждым годом. На сегодня это 6 586 013 574 поисковых запросов в день по всему миру.
Кстати на мобильных устройствах больше поисковых запросов Google, чем на компьютерах в 10 странах, включая США и Японию.
Рассмотрим наиболее популярные системы и выясним, какими достоинствами они обладают по сравнению с остальными участниками рейтинга.
Таблица 2
Поисковые запросы в Интернете
Поисковик |
Запросов в день |
4 464 000 000 | |
Bing |
873 964 000 |
Baidu |
583 520 803 |
Yahoo |
536 101 505 |
Другое (AOL, Ask и т.д.) |
128 427 264 |
Google является одним из наиболее используемых не только на просторах стран СНГ, но и во всем мире. По данным исследователей, самое большое количество посещений отмечено за юзерами Соединенных Штатов Америки, но и пользователи с других уголков планеты также не оставляют без внимания сайт google.com. В чем заключается основное преимущество этого ресурса? Дело в том, что на главной странице поисковика нет ничего лишнего, только строка поиска и логотип компании. Пользуясь этой поисковой системой, человек не отвлекается на рекламу или другие посторонние вещи, а четко выполняет запланированное действие.
Еще недавно yandex.com уверенно лидировал среди поисковиков, которыми пользуются жители постсоветского пространства. Но в 2017 году позиции системы заметно пошатнулись, что связано, скорее всего, с указом президента Украины о необходимости блокирования провайдерами сервисов Яндекс. Кстати, такое же ограничение касается интернет-ресурса mail.ru, на который также наложены санкции.
Yahoo занимает четвертое место
по популярности в мире. Но
при этом сложно назвать yahoo.
Библиографический список