Организация поиска информации в глобальных компьютерных сетях

Автор работы: Пользователь скрыл имя, 16 Февраля 2011 в 14:06, контрольная работа

Описание работы

Удобство Интернета в том, что в нем можно найти практически любую информацию, даже когда мы не знаем точно, где она находиться. Если адрес страницы с интересующим нас материалом неизвестен и страницы с подходящими ссылками тоже нет, приходиться разыскивать материалы по всему Интернету. Для этого применяют поисковые системы Интернета – специальные web-узлы, позволяющие найти нужный документ.

Файлы: 1 файл

4 сем. Сетев. технологии.doc

— 81.00 Кб (Скачать файл)

                                                                                                                      2

     I. Введение 

     Интернет  как средство информации в России пока не может конкурировать с  традиционными СМИ, но имеет в  этом отношении большие перспективы и сможет в дальнейшем выступать наравне с другими информационными ресурсами.

     В настоящее время свыше 500 млн. человек  более или менее регулярно  пользуются

     Интернетом, а через два года их число, по мнению экспертов, превысит 1 млрд., иными словами, более 16% населения Земли. Разумеется, такая колоссальная аудитория не могла остаться невостребованной – Интернет давно превратился в огромную информационную площадку.

     Во  всем мире, а теперь и у нас  в стране, наличие работающего Web-сайта становится признаком стабильной, профессиональной работы фирмы. Интернет давно уже стал не только средством общения, но и полем для серьезной коммерческой деятельности. Практически каждая зарубежная фирма имеет в Сети свое представительство, виртуальный офис. Суммарный оборот компаний, ведущих торговлю в Интернет, достигает миллиардов долларов. В России также все большее число компаний использует Интернет для продвижения своих товаров и услуг. В этом легко убедиться, просмотрев рекламные издания. Рядом с привычными номерами телефонов и факсов все чаще и чаще встречаются адреса электронной почты и Web-сайтов. Скоро отсутствие адреса в Интернет будет затруднять работу так же, как отсутствие факса. Тот, кто займет себе место сейчас, существенно выиграет в будущем. Это оперативность и актуальность. Традиционные средства массовой информации при всей их наглядности и привычности уже не способны обеспечить надлежащий уровень оперативности, требуемый современному человеку. Поэтому все больше и больше людей обращаются в Интернет, чтобы получить самую свежую информацию: об услугах и ценах, погоде, курсах

                                                                                                                                       3

валют, просто новости. На Web-сайте можно менять информацию несколько раз в день. В печатных изданиях надо заказывать рекламу минимум за неделю, а то и больше. А в Интернет все оперативно: новые товары или услуги, новая скидка или новый поставщик – завтра об этом узнают клиенты. Нет необходимости ждать, пока выйдет очередной выпуск печатной рекламы. Информация на сайте будет всегда актуальной, самой свежей. Именно это ценят, именно это привлекает в Интернет миллионы пользователей. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

                                                                                                                                  4

     II. Основная часть

      1. Поисковые системы и правила поиска информации 

     Удобство  Интернета в том, что в нем  можно найти практически любую  информацию, даже когда мы не знаем точно, где она находиться. Если адрес страницы с интересующим нас материалом неизвестен и страницы с подходящими ссылками тоже нет, приходиться разыскивать материалы по всему Интернету. Для этого применяют поисковые системы Интернета – специальные web-узлы, позволяющие найти нужный документ.

     Существует  два основных метода поиска в Интернете. В первом случае вы ищите web-страницы, относящиеся к определенной теме. Поиск производится путем выбора тематической категории и постепенным ее сужением. Подобные поисковые системы называют поисковыми каталогами. Они удобны, когда вам нужно познакомиться с новой для себя темой или добраться до широко известных «классических» ресурсов по данной теме. Второй способ поиска используется, когда тема носит узкий, специфический характер или нужны редкие, малоизвестные ресурсы. В этом случае вы должны представлять себе, какие ключевые слова должны встретиться в документе по интересующей вас теме. Эти слова надо выбрать таким образом, чтобы они, скорее всего, имелись в нужных документах, не имеющих отношения к выбранной теме. Системы, позволяющие выполнять подобный поиск, называют поисковыми указателями. Поисковые каталоги отличаются от поисковых указателей не только методом поиска, но и способом формирования. Любая поисковая система Интернета состоит из двух частей. Специализированная web-страница, доступная всем желающим и позволяющая выполнять поиск, опирается на большую, постоянно пополняемую и обновляемую базу данных, которая содержит сведения о ресурсах Интернета.

     Способ пополнения этой базы данных зависит от типа поисковой системы, поисковых каталогов самое главное – это точность отбора. Каждый найденный ресурс должен быть полезным. Тематика страницы определяется

                                                                                                                                       5

или проверяется  вручную. Из-за этого объем поисковых  каталогов относительно невелик. Когда  объем приближается к миллиону страниц, объем ручного труда настолько  велик, что дальнейший рост каталога останавливается.

     Поисковые указатели, напротив, ориентированы  на широту охвата. С определением слов, имеющихся на web-странице, вполне справляется автоматика, данных поискового указателя может охватывать многие миллионы web-страниц. При этом выполнять поиск в указателе труднее, чем в каталоге, потому что одни те же ключевые слова могут встречаться на web-страницах, посвященным разным темам.

     Информационно-поисковые  системы размещаются в Интернете  на общедоступных серверах. Основой  поисковых систем являются так называемые поисковые машины, или автоматические индексы. Специальные программы-роботы (известные также как пауки) в автоматическом режиме периодически обследуют Интернет на основе определенных алгоритмов, проводя индексацию найденных документов. Созданные индексные базы данных используются поисковыми машинами для предоставления пользователю доступа к размещенной на узлах Сети информации. Пользователь в рамках соответствующего интерфейса формулирует запрос, который обрабатывается системой, после чего в окно браузера выдаются результаты обработки запроса. Механизмы обработки запросов постоянно совершенствуются, и современные поисковые системы не просто перебирают огромное число документов. – Поиск ведется на основе оригинальных и весьма сложных алгоритмов, а его результаты анализируются и сортируются таким образом, чтобы представленная пользователю информация в наибольшей степени соответствовала его ожиданиям.  
В настоящее время в развитии поисковых систем наблюдается тенденция объединения автоматических индексных поисковых машин и составляемых вручную каталогов Интернет-ресурсов. Ресурсы этих систем удачно дополняют друг друга, в объединение их возможностей вполне логично.

                                                                                                                                  6

     Тем не менее исследования возможностей поисковых машин, даже самых мощных из них, таких как AltaVista или HotBot, показывают, что реальная полнота охвата ресурсов Всемирной паутины отдельной такой системой не превышает 30%. Поэтому не стоит ограничиваться использованием какой-либо одной из них. Если вам не удалось отыскать интересующую вас информацию с помощью одной системы, попробуйте воспользоваться другой.

     Каждая  поисковая Система имеет свои особенности и, и качество полученного результата зависит от предмета поиска и точности формулировки запроса. Поэтому, приступая к поиску информации, прежде всего, нужно четко представлять себе, что именно и где вы хотите найти. Например, зарубежные системы поражают числом проиндексированных документов. Для поиска в области профессиональных знаний, особенно информации на иностранном языке, такие системы, как AltaVista, HotBot или Northern, подходят наилучшим образом.

     Однако  для поиска информации на русском  языке, особенно в российской части Интернета, лучше приспособлены русские поисковые машины. Во-первых, они специально ориентированные именно на русскоязычные ресурсы Сети и, как правило, отличаются большей полнотой охвата и глубиной исследования эти ресурсов. Во-вторых, российские системы работают с учетом морфологии русского языка, то есть в поиск включаются все формы искомых слов. Российские системы лучше учитывают и такую исторически сложившуюся особенность российских Интернет-ресурсов, как сосуществование нескольких кодировок кириллицы. 
 
 
 
 
 

                                                                                                                                  7

     2. Обзор и характеристика  поисковых систем  сети Internet

     Rambler

     Для поиска русскоязычной информации в Интернете лучше использовать русские поисковые системы. В этом опыте и в следующих других мы будем искать информацию с помощью нескольких систем, предназначенных для поиска в русскоязычной части Интернета. Как вы увидите, принципиально они не отличаются от всемирных поисковых систем. Так как мы уже рассмотрели несколько систем, и вы знаете общие принципы поиска информации в Интернете, то в дальнейших опытах мы не будем подробно останавливаться на всех тонкостях. Так как эти системы общаются с вами на русском языке, то вы сможете самостоятельно изучить их, используя знания, полученные вами при выполнении предыдущих опытов.

     Выполним  поиск с помощью системы Рамблер. Как вы увидите, эта система обладает удобной системой поиска и выдачи найденной информации.

     Вы  можете выполнить поиск, как во Всемирной паутине, так и в группах новостей, а также в каталоге этой системы и в товарах. Кроме простого запроса имеется возможность работы с детальными запросами. Но мы выполним простой запрос, как и для других русских поисковых машин.

  • Введите в поле ввода запроса слова поиск Интернет. Мы хотим найти документы, одновременно содержащие слово «поиск» и слово «Интернет».
  • Нажмите кнопку Найти!. Мы получили список найденных страниц.

     Список  найденных страниц удобно организован. Вначале расположены ссылки на страницы, наиболее соответствующие критериям поиска. Наиболее полно удовлетворяют запросу документы, в которых искомые слова часто повторяются и стоят недалеко друг от друга. Кроме того, в кратком фрагменте текста найденного документа выделены обнаруженные ключевые слова.

     В системе Рамблер можно посмотреть слова, которые наиболее часто используются в запросах пользователей. Кроме  того, Рамблер ведёт список наиболее популярных Российских узлов Интернета. Так как вся информация в

                                                                                                                                       8

системе представлена на русском языке, мы надеемся, что вы сможете самостоятельно в дальнейшем познакомиться с возможностями данной поисковой машины.

      Yandex

     Поисковая система Яndех располагается по адресу www.уаndех.ru. Она была официально введена в эксплуатацию 23 сентября 1997 года.

     Что же такое Яndех? Вот как отвечают на этот вопрос создатели системы. Яndех – это полнотекстовая информационно-поисковая система (ИПС), учитывающая морфологию русского и английского языков. Система Яndех предназначена для поиска информации в электронных текстах различной структуры и разных способов представления (форматов). Яndех (произносится «яндекс») расшифровывается как «языковый индекс» или, в английском написании, Yandex – Yet Another INDEX. Также можно рассматривать Яndех как частичный перевод слова Index с английского на русский язык («I» означает «Я»).

     В основе поисковой системы Yandex. Ru лежит системное ядро, общее для всех продуктов с префиксом Яndex (Яndex. Site, Яndex. Lib, Яndex. Dict, Яndex.СD). Первые продукты серии Яndex (Яndex. Site, Яndex. Dict) были представлены широкой публике 18 октября 1996 года на выставке Netcom’96. Поисковая машина для «русского Интернета». явилась естественным продолжением линии Яndex. Как уже говорилось, в хорошем вопросе содержится половина ответа. Искать и находить нужное в ворохе текстов в Интернете – умение не только поисковой системы, мо и пользователя, задающего запрос. Яndex не требует от пользователя знания специальных команд для поиска. достаточно набрать вопрос («где найти дешевые компьютеры» или «нужны телефоны Москвы и Московской области»), и вы получите результат – список страниц, где встречаются эти слова. Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его

                                                                                                                                       9

формы по правилам русского языка. Например, если задан запрос идти, то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.

Информация о работе Организация поиска информации в глобальных компьютерных сетях