Автор работы: Пользователь скрыл имя, 14 Марта 2011 в 18:37, курсовая работа
Предметом являются информационно-поисковые языки сети Интернет.
Для достижения поставленной цели необходимо решить следующие задачи:
•провести анализ теоретической и научно-методической литературы по данной теме;
•описать основные типы информационно-поисковых языков;
•рассмотреть различные ИПС и провести сравнительный анализ применения в них информационно-поисковых языков.
Введение
Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развития глобальной информационной компьютерной сети.
В
90-е гг. ХХ в. человечество получило
доступ к огромному массиву информации
в самых разных предметных областях
– миллионам связанных
Быстрый рост и динамическое развитие информационных ресурсов обязывает каждого иметь разнообразные навыки сложного поиска. Уметь быстро и правильно искать в Интернете значит экономить время, владеть достоверной и актуальной информацией, а значит делать верные выводы и принимать правильные решения.
Все это свидетельствует об актуальности более глубокого изучения информационно-поисковых языков в сети Интернет, что и определило выбор темы нашего исследования.
В этой связи целью исследования является рассмотрение в теории и практике возможности использования информационно-поисковых языков в различных поисковых системах сети
Объектом исследования является интернет как единая информационная среда.
Предметом являются информационно-поисковые языки сети Интернет.
Для достижения поставленной цели необходимо решить следующие задачи:
Глава I. Обзор информационно-поисковых языков сети Интернет
§1.Информационно-
Главная
задача информационно-поисковой
Наиболее распространенными моделями представления документов в информационно-поисковой системе являются различные вариации на тему векторной модели, когда документ представляется как набор терминов. Но это не весь текст документа, а только небольшой набор терминов, который отражает его содержание. Базируясь на таком представлении о документе и рассмотрим различные информационно-поисковые языки (ИПЯ). [4]
Информационно
поисковый язык — искусственный
язык, предназначенный для
Формализация лексики и создание различных ИПЯ вызвано необходимостью устранения "избыточности" и "недостаточности" естественного языка для целей информационного поиска.
Как и в естественных языках, в информационно-поисковых языках используется некая лексика, то есть свой словарный состав. Лексические единицы (слова) ИПЯ могут быть простыми (элементарными) или сложными, то есть ИПЯ может иметь или не иметь свои средства «словообразования» – формирования более сложных лексических единиц из простых.
Основными элементами ИПЯ являются алфавит, лексика и грамматика. Алфавит ИПЯ система знаков, используемых для записи слов и выражений ИПЯ. Лексика, или словарный состав, ИПЯ совокупность слов, словосочетаний и выражений, используемых для построения текстов ИПЯ.[1]
По области или по сфере применения информационно-поисковых языков можно выделить:
Различают языки описания (декларативные языки), которые в свою очередь подразделяются на языки предкоординатные (классификационные) и посткоординатные (дескрипторные), а также процедурные языки - языки запросов и манипулирования данными .
Классификационные информационно-поисковые языки
Информационно-поисковые каталоги, основанные на классификации сведений по определенной предметной области, были первыми системами информационного поиска документов.
Первоначальные
подходы к классификации
Особенностью систем перечислительной классификации является возможность индексирования документов любым количеством рубрик, отражающих содержание документ. Для осуществления поиска необходимых документов по классификатору определяются коды интересующих пользователя рубрик и далее отбираются из хранилища те документы, которые проиндексированы соответствующими кодами. Отсутствие систематизированных связей и отношений между предметными рубриками является основным недостатком перечислительной классификации.
При
систематизированной
Содержание документа индексируется кодами соответствующих рубрик, однако при этом отпадает необходимость в явном указании более общих рубрик, к которым относятся выделенные полрубрики. В результате индексирование и поиск документов на основе иерархической классификации позволяют более адекватно отражать содержание документов и обеспечивают большую точность поиска.
Перечислительный
и иерархический подходы к классификации
используются в алфавитно-предметных
каталогах библиотек. Недостатком как
перечислительной, так и иерархической
классификации является принципиальная
невозможность заранее перечислить все
возможные темы документов.
Дескрипторные информационно-поисковые языки(ДИПЯ)
В
основе построения дескрипторных информационно-
Основными элементами ДИПЯ являются:
Словари лексических единиц делятся на две группы:
В качестве лексических единиц основных словарей используются ключевые слова, словосочетания и дескрипторы.
Дескриптор — понятие, обозначающее группу эквивалентных или близких по смыслу ключевых слов. Дескриптор - это имя класса синонимов. В качестве дескрипторов могут быть использованы код, слово или словосочетание.
Разработка дескрипторного языка фактически сводится к разработке информационно-поискового тезауруса (ИПТ).
Тезаурус
(от греч. «хранилище», «сокровищница»)
в узком смысле представляет собой
специальный словарь-
Наиболее важными парадигматическими отношениями ИПТ являются:
Обобщенная структура ИПТ включает как минимум три составляющих: словарную часть, семантическую карту, руководство по использованию. Словарная часть — алфавитный список дескрипторов с их словарными статьями. Семантическая карта — система тематических классов дескрипторов, представленная в виде графической схемы или таблицы. Руководство по использованию ИПТ содержит правила перевода ключевых слов и словосочетаний на ИПЯ, правила лексикографического контроля и редактирования поискового образа документа и поискового образа запроса, а также правила ведения ИПТ.
Отличием
информационно-поисковых
Главная
идея информационно-поисковых
В настоящее время происходит расширение сфер применения автоматических тезаурусов. При этом тезаурусы выступают составной частью современных систем подготовки текстов, осуществляя лингвистическую поддержку процесса подготовки и обработки текстов на естественном языке.
Среди наиболее перспективных направлений развития автоматических тезаурусов можно указать следующие:
Информация о работе Информационно-поисковые языки сети Интернет