Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля

Автор работы: Пользователь скрыл имя, 06 Сентября 2011 в 11:27, дипломная работа

Описание работы

Целью исследования является обоснование структуры лингвистического обеспечения научных сельскохозяйственных библиотек, способствующей максимально полному удовлетворению информационных потребностей ученых и практиков в релевантной информации по вопросам АПК.

Содержание работы

Введение - 3 -
Глава 1. Теоретические аспекты лингвистического обеспечения автоматизированных библиотечно-информационных систем. - 9 -
1.1. Понятие, состав и требования к современному лингвистическому обеспечению - 9 -
1. 2. Обзор лингвистического обеспечения сельскохозяйственных библиотек России и Украины - 17 -
1.2.2. Средства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук - 22 -
Глава 2. Структура лингвистических средств Белорусской сельскохозяйственной библиотеки им. И. С. Лупиновича Национальной академии наук Беларуси - 28 -
2.1. База данных УДК и ее применение в качестве информационно-поискового языка - 30 -
2.2. Тезаурус по сельскому хозяйству и продовольствию - 39 -
2.2.1. Назначение и структура тезауруса - 39 -
2.2.2. Парадигматические отношения - 45 -
2.2.3. Использование тезаурусов - 54 -
2.3. Проблема выбора средств лингвистического обеспечения и их интеграции в библиотеках АПК. - 58 -
Заключение - 62 -
Приложение №1…………………………………………

Файлы: 1 файл

DIPLOM.doc

— 855.00 Кб (Скачать файл)

    - удобство восприятия ПОД с латинскими дескрипторами, благодаря визуализации их русских эквивалентов (синонимы с меткой <рус>). 
     

      Ассоциативные отношения - это любой вид смысловых отношений между понятиями, возможный в данной предметной области, кроме отношений синонимии.

      Одним из критериев установления ассоциативных отношений между терминами является достаточно частая совместная встречаемость их в литературе, однако решающим является полезность такой связи для индексатора при подборе им нужных терминов для индексирования какого-либо понятия. Ассоциативную связь (метка а) следует воспринимать как рекомендацию обратить внимание на термины, имеющие какое-либо отношение к индексируемому понятию, т. е. пересекающиеся с ним но какому-либо аспекту отображения.

      Ассоциативные отношения устанавливаются в основном: 

  • между дескрипторами разных иерархических деревьев одной категории (например, между дескрипторами тематической области «Ветеринария»);
  • между дескрипторами разных категорий (например «Животноводство. Кормление животных. Корма» и «Пищевая промышленность. Продукты питания»);
  • между дескрипторами, содержательно относящимся к одному иерархическому дереву (как правило, с развитым «ветвлением»), для устранения неоправданного возрастания объема тезауруса, а также информационного шума за счет маловажных для поиска терминов. В тезаурусе зафиксированы следующие распространенные логические связи между терминами, а также отношения, полезные с точки зрения индексирования и поиска:
 

- причина - следствие:

ветровая эрозия

а пыльные бури 

- часть - целое:

      крс

      а породы крс 

- предмет-процесс:

      плуги

      а вспашка 

- вещество - его производные:

      фенол

      а карболовая кислота 

- сходство или общность некоторых признаков:

биотипы

а генотипы 

- организм (растения, животные, микроорганизмы и т. п.) -вид использования:

    acer tataricum

    а декоративные деревья 

- предмет, явление - аспекты рассмотрения:

    паразито-хозяинные отношения

    а круг хозяев 

- используемые растения, животные, микроорганизмы -научное наименование рода или вида:

      пшеница

      а triticum 

      Приведенные примеры, конечно, не исчерпывают всех видов логических отношений между понятиями. По мере появления новых знаний, ввода новых дескрипторов количество и разнообразие ассоциативных связей в тезаурусе возрастает. Гак несомненно полезным для поиска является фиксация ассоциативных отношений типа «сырье-продукт», «свойство-носитель свойства», антонимия и др.

      Ранее отмечалось, что в определенных случаях ассоциативные отношения устанавливаются между понятиями, которые фактически находятся в родовидовых, т. с. иерархических отношениях, но эти отношения нецелесообразны с точки зрения поиска. Иерархические деревья таких широких понятий, как, например, РАСТЕНИЯ или ЖИВОТНЫЕ имели бы слишком большое количество нижестоящих терминов, сложную структуру, большую глубину иерархии, что нецелесообразно, т. к. поиск по таким дескрипторам вряд ли возможен. Поэтому словарные статьи таких дескрипторов включают, как правило, только термины с меткой ассоциативной связи. 
 

Пример:

    растения

 а вечнозеленые растения

 а декоративные растения 

     а с-х культуры

     а ядовитые растения 
     

      Разрыв иерархической цепочки в «безвредной» для поиска точке и установление в этом месте ассоциативной связи часто используется в тезаурусе в научных классификациях организмов. Именно так предполагается связать, например, ботанические семейства с верхними таксонами.

Ассоциативные отношения не следует устанавливать между дескрипторами, связь между которыми очевидна:

Пример: 

    болезни зубов    зубы

    В1 хирургические болезни В1 ротовая полость

    Н1 пародонтоз В2 пищевой тракт 

      Ассоциативно связанные с дескриптором термины с меткой а размещаются в конце словарной статьи дескриптора. Метка является симметричной (двунаправленной) и контролируется программными средствами. 

Пример: 

    несовместимость конкуренция

    а конкуренция а несовместимость 

      Изучив словарные статьи ассоциативных терминов, индексатор может найти в них дескрипторы, которые уточняют выбранное понятие или отражают какие-либо аспекты его рассмотрения, важные с точки зрения поиска. Кроме того, возможно, в словарных статьях ассоциативных терминов, будет найден дескриптор, более точно отражающий тему документа, чем ранее выбранный. 

2.2.3. Использование тезаурусов 

      Индексирование - это перевод содержания документа и запроса с естественного на информационно-поисковый язык. В зависимости от типа ИПЯ (иерархическая классификация, дескрипторный ИПЯ) индексирование реализуется в процессах:

  • предметизации (индексирование на языке предметных рубрик, алфавитно-предметной классификации):
  • систематизации литературы на языке классификационных иерархических ИПЯ;

    - координатного индексирования на языке дескрипторного ИПЯ или языка ключевых слов.  

      В зависимости от ИПЯ результатом индексирования, т. е. элементом ПОД на соответствующем ИПЯ, будет либо предметная рубрика, либо индекс классификации, либо набор дескрипторов или ключевых слов. 

    Отметим некоторые общие положения индексирования с помощью ИПТ.

    При выборе аспектов индексирования содержания документа индексатор должен принимать во внимание:

  • аспекты, которые выделяет автор работы - это видно из заглавия, определения целей и задач работы, самого исследования, заключения и выводов;
  • темы, к которым данная работа имеет непосредственное отношение, хотя сам автор это не подчеркивает (такой анализ документа требует большой компетентности индексатора как специалиста):
  • как положительные, так и отрицательные результаты работы.

      Качество индексирования и эффективность поиска зависят от соблюдения следующих правил индексирования:

    - максимально полно использовать лексический состав тезауруса, его структуру и связи между терминами;

  • подбирать дескрипторы с учетом возможного использования их пользователем в поисковых предписаниях (ПОЗ);
  • отражать разные аспекты содержания документа достаточным количеством дескрипторов, с тем чтобы

    документ был найден по запросам пользователей разных специальностей.

      Каждый выделенный аспект содержания документа следует индексировать как можно более специфичными дескрипторами и не использовать дополнительно более широких понятий. Однако если в содержании документа затрагивается и широкий аспект, и один или два узких, следует использовать и общий дескриптор, и один или два специфичных. Например, для индексирования статьи о породах овец, разводимых в Алтайском крае, следует использовать общий термин ПОРОДЫ ОВЕЦ и ГОРНОАЛТАЙСКИЕ ОВЦЫ, если этой породе уделено особое внимание.

      Если для отражения понятия индексатор в тезаурусе не находит точного эквивалента, необходимо подобрать дескрипторы, близкие по смыслу.

      В словарной статье дескриптора нужно принимать во внимание все элементы ее структуры:

  • лексическое примечание и аскрипторы дают представление об объеме понятия, уточняют его содержание, область применения;
 
  • ассоциативные термины - это дополнительный список дескрипторов, имеющих какое-либо отношение к данному понятию, среди них могут оказаться полезные для индексирования его аспектов. В случае растений, микроорганизмов, насекомых, рыб, диких животных и т.п. обращение к статьям ассоциативных дескрипторов обязательно для уточнения латинского наименования семейства рода или вида.
  • иерархические отношения дают возможность легко подобрать наиболее специфичный дескриптор.

       Например, для индексирования из алфавитного списка вначале был отобран дескриптор КУЛЬТИВИРУЕМЫЕ ГРИБЫ. В словарной статье этого дескриптора имеются вышестоящие термины (две ветви), т. е. дескриптор входит в иерархическое дерево с двумя вершинами: НИЗШИЕ РАСТЕНИЯ и ОВОЩНЫЕ КУЛЬТУРЫ. Двигаясь по иерархическому дереву вниз, т. е. просматривая нижестоящие термины, можно найти среди них более специфичный термин, чем выбранный вначале, например, ВЕШЕНКА, более точно отражающий индексируемое понятие. Движение вверх по иерархическому дереву приведет к более широким понятиям, использование которых при наличии более специфичных дескрипторов, конечно, недопустимо. 

     Если специфичный термин еще не введен в тезаурус, но включен в картотеку кандидатов в дескрипторы, он может быть использован для индексирования, но при этом индексатор должен выбрать из тезауруса еще и близкий по смыслу дескриптор или более широкое понятие. Так же следует поступать и с новыми понятиями, для отражения которых в картотеке нет терминов, при этом индексатор должен внести в картотеку использованное ключевое слово. На его карточке должны быть приведены известные индексатору сведения о термине, необходимые для включения его в тезаурус: вышестоящие и нижестоящие термины, синонимы, ассоциативные термины, лексическое примечание, если оно необходимо. Если термин не рекомендуется вводить в тезаурус, на карточке ставится помета «КЛ» (ключевое слово). 

      Компьютерная база данных ИПТ позволяет выводить его на печать автоматизированным способом в различных формах. Используемые в настоящее время печатные формы -дескрипторный словарь и лексико-семантический указатель (ЛСУ) имеют следующую последовательность знаков: 

    • цифры (0-9);
    • латинский алфавит (А-2);
    • русский алфавит (А-Я).
 
 

      В пределах одной записи пробел предшествует знаку «дефис».

      Дескрипторный словарь представляет собой алфавитный список дескрипторов и аскрипторов - терминов, запрещенных для использования при индексировании, со ссылкой на соответствующий дескриптор.

      В ЛСУ термины даны в алфавитном порядке со своим семантическим окружением, составляющим словарную статью термина.  Словарная статья дескриптора может  включать лексическое    примечание,    синонимы,    вышестоящие    и нижестоящие дескрипторы и ассоциативные термины. Один и тот же дескриптор может присутствовать в словарных статьях нескольких    других    терминов    -    в    зависимости    от парадигматических отношений,  установленных с ними  в основной  классификационной  схеме  понятия.  Словарную статью аскриптора составляет сам аскриптор и дескриптор, который  следует  использовать  вместо  него. [43, C. 62-66].

      Развитие тезауруса БД АГРОС носит динамический характер, что обусловлено появлением новых областей знаний, тематическим     расширением     документального совершенствованием   дескрипторного   языка   и   структуры тезауруса, задачами совместимости его с другими ИПЯ числе с тезаурусами международных ИПС, совпадающими по тематическому охвату с БД АГРОС. Такими тезаурусами являются Тезаурус САВI (САВ Thesaurus)* и тезаурус (AGROVOC). Для решения проблемы полной совместимости необходимо: 

Информация о работе Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля