Автор работы: Пользователь скрыл имя, 06 Сентября 2011 в 11:27, дипломная работа
Целью исследования является обоснование структуры лингвистического обеспечения научных сельскохозяйственных библиотек, способствующей максимально полному удовлетворению информационных потребностей ученых и практиков в релевантной информации по вопросам АПК.
Введение - 3 -
Глава 1. Теоретические аспекты лингвистического обеспечения автоматизированных библиотечно-информационных систем. - 9 -
1.1. Понятие, состав и требования к современному лингвистическому обеспечению - 9 -
1. 2. Обзор лингвистического обеспечения сельскохозяйственных библиотек России и Украины - 17 -
1.2.2. Средства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук - 22 -
Глава 2. Структура лингвистических средств Белорусской сельскохозяйственной библиотеки им. И. С. Лупиновича Национальной академии наук Беларуси - 28 -
2.1. База данных УДК и ее применение в качестве информационно-поискового языка - 30 -
2.2. Тезаурус по сельскому хозяйству и продовольствию - 39 -
2.2.1. Назначение и структура тезауруса - 39 -
2.2.2. Парадигматические отношения - 45 -
2.2.3. Использование тезаурусов - 54 -
2.3. Проблема выбора средств лингвистического обеспечения и их интеграции в библиотеках АПК. - 58 -
Заключение - 62 -
Приложение №1…………………………………………
Приложение № 1
Основные понятия применяющиеся в среде лингвистического обеспечения АБИС СЛОВАРЬ
Виды словарей
Машинный
словарь - словарь,
находящийся в памяти ЭВМ и использующийся
для автоматического и/или контролируемого
индексирования.
Рубрикатор
- разновидность словаря, содержанием
которого является перечень предметных
рубрик и их классификационных индексов.
Одним из наиболее распространенных видов
рубоикаторов являются иерархические
тематические рубрикаторы (УДК, ГРНТИ,
ББК, МКИ и др.).
Тезаурус
(информационно-поисковый) - словарь,
содержащий разрешенные для использования
при индексировании лексические единицы
ИПЯ, а также парадигматические отношения
между этими лексическими единицами.
Тезаурусы различают по принципу их организации
(например, алфавитный, иерархический,
фасетный), способу использования (например,
машинный тезаурус,
т.е. находящийся в памяти ЭВМ), тематике
и полноте охвата его лексикой определенной
предметной области (например, базовый
тезаурус, рабочий тезаурус, многоотраслевой
тезаурус, узкотематический тезаурус
и т.п.) В некоторых автоматизированных
информационых системах
словари, выполняющие функции тезауруса,
носят иные названия, например Базовый
терминологический словарь (БТС) ВИМИ.
Предметная
рубрика - краткое наименование классификационного
признака однородных объектов (узко) библиографической
или (широко) информационной деятельности.
Классификационный
индекс - условное обозначение цифровыми
или буквенно-цифровыми символами деления
какой-либо системы классификации.
Синонимия
- совпадение или близость значений различных
слов (синонимов).
Омономия
- внешнее совпадение слов, одинаковых
по написанию и звучанию (омонимов).
Лексическая
единица - обозначение отдельного понятия
в естественном или специально созданном
искусственном языке, например ИПЯ.
Лексическая единица может иметь вид слова,
устойчивого словосочетания, аббревиатуры,
символьного кода и т.п.
Виды отношений и связанные с ними термины Ассоциативные отношения
Парадигматические отношения, аналитические отношения, ассоциативные отношения - вид логических отношений между лексическими единицами ИПЯ (дескрипторами, ключевыми словами и т.п.), не зависящими от конкретного контекста, в котором соответствующие им понятия употребляются. Парадигматические отношения позволяют осуществлять избыточное индексирование текстов путем включения в поисковый образ документа и поисковое предписание близких по смыслу лексических единиц ИПЯ для повышения полноты поиска.
Семантические отношения - отношения между понятиями в "семантических сетях". Различают лингвистические (соответствующие и взаимоотношению слов в предложении), теоретико-множественные и логические отношения.
Синтагматические
отношения, текстуальные отношения, синтаксические
отношения - отношения между лексическими
единицами ИПЯ (дескрипторами, ключевыми
словами и т.п.), которые выражают логические
связи между соответствующими понятиями
в тексте документа. Синтагматические
отношения являются разновидностью
семантических отношений.
Синтагма
- группа лексических единиц,
связанных синтагматическими отношениями
и представляющих собой законченное предложение
на информационно-поисковом языке.
Фасет
- группа однородных терминов, связанных
общностью какого-либо признака (характеристики,
основания деления). Служит средством
построения ИПЯ фасетной структуры.
Индексирование - это процесс перевода содержания документов и запросов с естественного на информационно-поисковый язык, в результате чего создаются поисковые образы документов (ПОД) и поисковые предписания (ПП).
Индексирование, наряду с составлением библиографического описания, реферированием, аннотированием , составлением обзоров, является разновидностью аналитико-синтетической обработки или свертывания информации.
В зависимости от ИПЯ (иерархическая классификация, алфавитно-предметная классификация, дескрипторный ИПЯ) индексирование может воплощаться в следующих процессах:
-предметизация, т.е. индексирование на основе языка предметных рубрик, алфавитно-предметной классификации
-систематизация литературы, осуществляемая на базе классификационных иерархических ИПЯ
-координатное индексирование, реализуемое на основе дескрипторного ИПЯ или языка ключевых слов.
Соответственно, в зависимости от используемого ИПЯ, результатом индексирования т.е. ПОД и ПП, могут быть либо индекс классификации, либо перечень дескрипторов или
ключевых
слов.
Информационно-поисковый
язык (ИПЯ) - это искусственный язык,
предназначенный для выражения содержания
документов или запросов или описания
фактов с целью последующего поиска.
Дескрипторный
ИПЯ - это ИПЯ, лексическими единицами
которого являются дескрипторы и использование
которого основано на принципе координатного
индексирования.
Координатное индексирование - это индексирование путем перечисления ключевых слов и/или дескрипторов.
Принцип координатного индексирования заключается в том, что центральная тема документа или информационного запроса выражается в виде перечня наиболее значимых слов или словосочетаний, которые являются как бы координатами документа или запроса.
В
состав лексики отбирают не любые слова
вообще, а "ключевые слова", т.е. слова,
несущие в тексте наибольшую смысловую
нагрузку.
Ключевое
слово - это полнозначное слово или словосочетание,
являющееся носителем существенной в
данном тексте (документе или запросе)
информации с точки зрения информационного
поиска.
Нормативный
словарь, в котором в едином алфавитном
ряду приведены все важнейшие ключевые
слова и дескрипторы отрасли или области
знаний с соответствующими пометами, называется
дескрипторным словарем.
Нормативный
словарь дескрипторов и ключевых слов
с зафиксированными парадигматическими
отношениями, предназначенный для координатного
индексирования документов и запросов,
называется информационно-поисковым
тезаурусом. Слово "тезаурус" происходит
от греческого слова 'ЧЬезаип" - сокровище.
Лексика дескрипторного ИПЯ в качестве
основных лексических единиц включает
дескрипторы и аскрипторы.
Дескриптор
- это нормализованное слово, или словосочетание,
выбранное из группы синонимичных или
близких по значению, ключевых слов (класса
условной эквивалентности) и предназначенное
для индексирования документов и запросов,
др. словами - нормализованное слово, которому
искусственным путем придана смысловая
однозначность.