Автор работы: Пользователь скрыл имя, 31 Января 2012 в 20:07, контрольная работа
1.Назовите отличительные черты Интернет от других сетей.
2. Какое событие повлияло на развитие современного Интернет.
3. С какой целью создавался Интернет.
Этот ироничный пример иллюстрирует, что пользователь, основываясь на своих знаниях и логике, должен выделить только необходимые ключевые слова, не перегружая запрос лишними терминами.
Рассмотрим пример, иллюстрирующий типичные ошибки начинающих пользователей при поиске в Интернете. На запрос загадки о музыкальных инструментах поисковик не выдал полезных результатов. Тогда пользователь решает исправить запрос, дополнив его и написав: загадки для детей о музыкальных инструментах – результаты поиска оказались еще хуже предыдущего. В такой ситуации говорят, что условия запроса стали более жесткими в отличие от более мягких, установленных в предыдущем случае. Для данного примера неплохим решением, как показала практика, явился поиск по ключевому слову загадки. В Интернете много таких сайтов, а зайдя на сам сайт и немного поискав по его разделам, вполне можно найти интересующую информацию.
Рассуждая о том, какие слова нужно использовать в поисковом запросе, можно сформулировать несколько правил:
• выбирайте только самые важные ключевые слова, касающиеся рассматриваемой темы;
• слов не должно быть слишком много или слишком мало; некоторые считают оптимальным запрос, состоящий из трех-четырех слов, однако в разных случаях это количество может различаться;
• при неудовлетворительных результатах поиска попробуйте применить более мягкие условия для запроса, но ни в коем случае не более жесткие;
• если вы не удовлетворены результатами поиска на одном поисковом сервере, то попробуйте поискать на другом; механизмы работы у серверов неодинаковые, так что результаты могут различаться коренным образом.
Для
обеспечения более эффективного
поиска в Интернете поисковые
серверы предоставляют
Расширенный
поиск – возможность поиска с
указанием множества различных
параметров. Для этого в поисковиках
предусмотрены отдельные
Язык запросов – система команд, позволяющая изменять параметры запроса из основной строки поиска с помощью специальных команд. Ориентирован на опытных пользователей.
Высокая
доступность огромного
Определение
информационному шуму можно дать,
опираясь на понятия релевантности.
Релевантность – это
«Информационный шум – это когда изобилие поступающей человеку информации делает большую её часть нерелевантной (то есть не полезным сигналом, а именно «шумом»)»
Таким образом, будем понимать под информационным шумом ненужную, несвоевременную информацию, мешающую потребителю воспринимать другую – соответствующую его запросам.
Зачастую при визуальной фильтрации контента и оценке его значимости пользователь теряет массу времени. Спасают положение антиспам-фильтры, блокировщики баннеров и всплывающей рекламы и пр.
Поисковый спам представляет собой веб-ресурс, созданный путем использования обманных методов поисковой оптимизации в целях манипуляции результатами выдачи поисковых систем.
Для чего это нужно, кто-то может спросить? Ответ очевиден – для того, чтобы обеспечить своему Интернет-проекту присутствие в верхних позициях рейтинга той или иной поисковой системы. В свою очередь, нахождение сайта в ТОПе означает высокий трафик (количество посетителей). Чем выше будет последний, тем больший будет доход с веб-ресурса. Собственно в этом и кроется единственная причина массового распространения поискового спама в сети Интернет. Виды поискового спама неразрывно связаны с разнообразием обманных техник поисковой оптимизации. Другими словами, если мы говорим о видах поискового спама, то подразумеваем различные способы “черной” раскрутки.
К
популярным видам поискового спама
принадлежит использование “
Наполнение веб-страницы неадекватным (завышенным) числом ключевиков – еще один пример создания в сети поискового спама. Веб-мастера или оптимизаторы, действующие подобным образом, убеждены, что чрезмерная плотность ключевых слов способна вывести их ресурс в лидеры по тем или иным поисковым запросам. Иной раз такое и в самом деле может получиться. Но как же быть с пользователем, который, попадая на сайт, сталкивается с бессмысленной абракадаброй на его страницах?! Это, похоже, такого рода специалистов волнует меньше всего. К проявлениям поискового спама также можно отнести и ситуацию, когда страницы веб-проекта сознательно наполняются ключевыми словами, абсолютно не соответствующим тематике сайта. Делается это в надежде на то, что какой-нибудь популярный поисковый запрос (запросы) сможет повлиять на поднятие сайта в рейтинге поисковика.
Дублирование страниц сайта также является поисковым спамом. Суть метода предельно проста – заполнив одну страницу добротным уникальным контентом, горе-оптимизатор создает еще несколько идентичных страниц. Какая в этом выгода? Во-первых, экономическая – не нужно тратить деньги на покупку нового текстового материала. Во-вторых, рабочая – нет нужды тратить время и усилия на создание контента, оптимизированного под определенные ключевые слова или фразы.
Разновидностями поискового спама являются также свопинг и клоакинг.
Особое место в среде поискового спама занимают дорвеи. Последние представляют собой своего рода “входные” страницы.
Интернет-каталоги - это большие сайты справочно-информационного характера, на которых пользователи могут найти сайты нужной тематики. Между каталогами и поисковыми системами есть существенные различия (основное - в каталоге пользователь сам ищет нужный ресурс, выбирая рубрики, это не всегда удобно, т.к. часто логика посетителя каталога отличается от логики, применяемой к распределению сайтов по тематике. В поисковой же системе необходимо лишь сделать запрос и вы получите уже отобранные по теме ссылки на тематические ресурсы).
Также поисковый ресурс, поисковая система, поисковик, искалка - программно-аппаратный комплекс, предназначенный для осуществления поиска в Интернете и реагирующий на запрос пользователя, задаваемый текстовой фразой, выдачей набора ссылок на страницы и сайты, соответствующего запросу (по мнению поисковой машины).
Яndex (http://www.yandex.ru) – самая популярная в настоящее время отечественная поисковая система. Начала работу в 1997 г. Она содержит более 33 миллионов документов, поддерживает собственный каталог Интернет-ресурсов. Также является лучшей поисковой системой для выявления иллюстраций. Англоязычный вариант снабжен справочником ресурсов Интернет. Обладает развернутой системой формирования запроса. В частности, допускается ввод поискового предписания на естественном языке - в этом случае все необходимые расширения производятся автоматически. Более детальный запрос может быть составлен с помощью режима «Расширенный поиск» (знак +), в котором применяется система многоступенчатых меню.
Яндекс - единственная российская поисковая система, индексирующая документы в форматах PDF, DOC, RTF, SWF, PPT и XLS. Актуализация базы осуществляется еженедельно.
Rambler (http://www.rambler.ru) – одна из первых российских ИПС, открыта в 1996 году. В конце 2002 года была произведена коренная модернизация, после которой Rambler вновь вошел в группу лидеров сетевого поиска. В настоящее время объем индекса составляет порядка 150 миллионов документов. Для составления сложных запросов рекомендуется использовать режим «Детальный запрос», который предоставляет широкие возможности для составления поискового предписания с помощью пунктов меню.
АПОРТ (http://www.aport.ru). На сегодняшний день объем ее базы составляет более 20 миллионов документов. Система обладает широким спектром поисковых возможностей. АПОРТ обладает функцией встроенного переводчика, это дает пользователю возможность формулировать запросы, как на русском, так и на английском языках. Кроме того, АПОРТ имеет специальные режимы для поиска иллюстраций и аудио файлов.
Поисковая система компании Mail.ru начала работать в 2007 году. Объем индексного файла весной 2009 г. составлял более 1.5 миллиарда страниц, расположенных на русскоязычных серверах. Помимо разыскания текстов, системой осуществляется поиск иллюстраций и видеофрагментов, размещенных на специализированных "самонаполняемых" российских серверах: Фото@Mail.Ru, Flamber.Ru, 35Photo.ru, PhotoForum.ru, Видео@Mail.Ru, RuTube, Loadup, Rambler Vision и им подобных. Gogo.ru позволяет ограничивать область поиска сайтами коммерческой направленности, информационными сайтами, а также форумами и блогами. Форма "Расширенного поиска" также дает возможность ограничить разыскания определенными типами файлов (PDF, DOC, XLS, PPT), местом положения искомых слов в документе или определенным доменом.
Google
(http://www.google.com) — одна из самых полных зарубежных
ИПС. Объем ее базы составляет более 560
миллионов документов. Отличительной
особенностью ИПС Google является технология
определения степени релевантности документа
путем анализа ссылок других источников
на данный ресурс. Чем больше ссылок на
какую-либо страницу имеется на других
страницах, тем выше ее рейтинг в ИПС Google.
3. Какими преимуществами обладает поисковая машина перед тематическим каталогом.
На каждом поисковом сайте есть раздел помощи, зайдя в который можно почитать об особенностях синтаксиса составления запросов. При помощи специальных символов можно составлять достаточно сложные запросы, в которых указывать не только нужные слова, их формы, но и слова, которые не должны присутствовать на странице.
В отличие от поисковой машины в тематическом каталоге нельзя искать информацию по содержанию сайтов, можно лишь ознакомиться с кратким описанием веб-ресурса.
Булева модель, булевая, двоичная (boolean) — модель поиска, опирающаяся на операции пересечения, объединения и вычитания множеств.
На расширение: конъюнкция, эквивалентность
На сужение: дизъюнкция, импликация
Тезаурусы используют в своей работе специалисты, в той или иной степени связанные с подготовкой и обработкой текстовой информации: переводчики, редакторы, научные работники, референты и др.
Тезаурусы разрабатываются для отдельных отраслей. Например, существует «Тезаурус по документации», «Дескрипторный словарь по информатике» и т.п. Тезаурус может быть разработан и для обслуживания конкретной информационно-поисковой системы.
В настоящее время происходит расширение сфер применения автоматических тезаурусов. При этом тезаурусы выступают составной частью современных систем подготовки текстов, осуществляя лингвистическую поддержку процесса подготовки и обработки текстов на естественном языке.
Среди наиболее перспективных направлений развития автоматических тезаурусов можно указать следующие: