Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля

Автор работы: Пользователь скрыл имя, 06 Сентября 2011 в 11:27, дипломная работа

Описание работы

Целью исследования является обоснование структуры лингвистического обеспечения научных сельскохозяйственных библиотек, способствующей максимально полному удовлетворению информационных потребностей ученых и практиков в релевантной информации по вопросам АПК.

Содержание работы

Введение - 3 -
Глава 1. Теоретические аспекты лингвистического обеспечения автоматизированных библиотечно-информационных систем. - 9 -
1.1. Понятие, состав и требования к современному лингвистическому обеспечению - 9 -
1. 2. Обзор лингвистического обеспечения сельскохозяйственных библиотек России и Украины - 17 -
1.2.2. Средства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук - 22 -
Глава 2. Структура лингвистических средств Белорусской сельскохозяйственной библиотеки им. И. С. Лупиновича Национальной академии наук Беларуси - 28 -
2.1. База данных УДК и ее применение в качестве информационно-поискового языка - 30 -
2.2. Тезаурус по сельскому хозяйству и продовольствию - 39 -
2.2.1. Назначение и структура тезауруса - 39 -
2.2.2. Парадигматические отношения - 45 -
2.2.3. Использование тезаурусов - 54 -
2.3. Проблема выбора средств лингвистического обеспечения и их интеграции в библиотеках АПК. - 58 -
Заключение - 62 -
Приложение №1…………………………………………

Файлы: 1 файл

DIPLOM.doc

— 855.00 Кб (Скачать файл)
  • категоризация лексического состава:
  • построение классификационных схем основных понятий, соответствующих его тематическому диапазону.

      В состав Тезауруса по сельскому хозяйству и продовольствию входит лексика разных отраслей и областей знаний. Вопросы категоризации ЛЕ в политематическом тезаурусе имеют определенные трудности, особенно если терминология специфических областей включается в его состав на заключительных этапах построения классификационных схем ИПТ.

      Категоризация лексики - это разбиение ЛЕ на определенные тематические группы, представленные общими терминами этих групп. Основой категоризации лексики являются рубрики Рубрикатора по сельскому хозяйству и продовольствию. Важное условие категоризации -непересекаемость понятий, отнесенных к разным категориям. Например, для отрасли «Животноводство» выделены непересекающиеся категории, отражаемые общими терминами ЖИВОТНЫЕ (полезные, дикие животные и др.); РАЗВЕДЕНИЕ ЖИВОТНЫХ (методы и способы создания новых пород, их разведение и т. п.); КОРМЛЕНИЕ и др.. Кроме категорий, специфичных для каждой отрасли или области знаний. в тезаурусе выделены категории общезначимой лексики, например, ОБОРУДОВАНИЕ; СВОЙСТВА; ТЕХНОЛОГИЧЕСКИЕ ПРОЦЕССЫ и др. (учреждения; страны; науки и т. п.).

      Построение    классификационных схем это установление парадигматических, т. е. внеконтекстных логических связей для ЛЕ, относящихся преимущественно, но необязательно, к одной категории. Если ЛЕ имеет признаки нескольких категорий (многозначность или полисемия) необходимо либо заменять ее другими более специфичными терминами либо присоединять к ней особую помету - релятор. Так ЛЕ ГОРЧИЦА отнесена к тематической области «Растениеводство», а ГОРЧИЦА (ПРИПРАВА) как продукт питания - к области "Пищевая промышленность". Словарная (тезаурусная) статья дескриптора является наглядным изображением классификационной схемы понятия, отображаемого данной ЛЕ, и может содержать:

  • лексическое примечание;
  • аскрипторы;
  • вышестоящие термины с указанием уровня иерархии;
  • нижестоящие термины с указанием уровня иерархии;
  • ассоциативные термины.

      Словарная статья аскриптора включает только сам аскриптор и ссылку на дескриптор, который следует использовать вместо него.

      Место каждой ЛЕ в структуре отношений тезауруса определяется специальными метками или ссылками. В разработанном и отлаженном ИПТ не должно быть одиночных терминов, не имеющих связей.

      Общим правилом при построении тезауруса является строгая взаимность ссылок (контролируется программными средствами), определяющих вид парадигматических отношений.

    В таблице 1 представлены метки, используемые в словарных статьях для обозначения парадигматических связей между терминами, и другие элементы структуры статей. 
 

Значения меток в словарных статьях дескрипторов и аскрипторов 

Метка Значение метки Статус заглавного термина словарной статьи Вид связи
 
В
вышестоящий термин  
дескриптор
 
иерархическая
Н нижестоящий термин дескриптор иерархическая
 
а
ассоциативный термин  
дескриптор
 
ассоциативная
см отсылка к дескриптору аскриптор-синоним
    синонимия
с аскриптор-синоним дескриптор
    синонимия
рус аскриптор на русском языке дескриптор-латынь
    синонимия
 
исп
отсылка к дескриптору аскриптор-омоним
    синонимия
О аскриптор-омоним дескриптор
    синонимия
 
()
лексическое примечание  
дескриптор
    расшифровка,

    уточнение,

    тематическая

    «привязка»

    термина

Классификационная схема отдельного понятия складывается из иерархии дескрипторов, отношений  синонимии и ассоциативных связей. 

2.2.2. Парадигматические отношения.

      При построении словарных статей иерархические отношения устанавливаю гея между понятиями, объем одного из которых составляет часть объема другого. К ним относятся, например, отношения типа «род-вид», «часть-целое»; «шире-уже» и т. п. Более широкое понятие (подчиняющее, вышестоящее) имеет больший объем, оно выражает существенные признаки класса предметов, процессов и т. п., которые являются частью этого широкого понятия, подчиненными ему или нижестоящими.

      При построении тезауруса все основные понятия его тематического диапазона рассматриваются с точки зрения выделения наиболее существенных признаков этих понятий. Выделенные признаки используются в качестве основания деления широких понятий на более узкие. Эти узкие понятия по какому-либо существенному признаку делятся на еще более узкие. Таким образом строится классификационная схема какого-либо понятия с иерархической структурой - так называемое иерархическое дерево.

Например, одним из основных понятий тематической области «Ветеринария» является понятие БОЛЕЗНИ ЖИВОТНЫХ. Основанием деления одного из них -ИНФЕКЦИОННЫЕ БОЛЕЗНИ ЖИВОТНЫХ - является этиология заболеваний (по возбудителям). По этому принципу выделены нижестоящие понятия: БАКТЕРИАЛЬНЫЕ БОЛЕЗНИ, ВИРУСНЫЕ БОЛЕЗНИ, МИКОПЛАЗМЕННЫЕ БОЛЕЗНИ и др. Рассмотрим формирование дерева понятия БАКТЕРИАЛЬНЫЕ БОЛЕЗНИ ЖИВОТНЫХ. Известно, что бактериальные болезни животных вызывают бактерии из разных   таксономических   групп.   Однако   классификация заболеваний только но таксономической принадлежности возбудителей явно недостаточна. Она не отвечает, например, интересам специалистов по анаэробным инфекциям: чтобы найти нужные документы, пользователь должен перечислить в запросе все заболевания, относящиеся к этой группе, искать ее по терминам текста или ключевым словам, что, как правило, не дает удовлетворительного результата. Задача решается, если классификацию бактериальных болезней проводить еще по одному специфическому признаку (основанию деления), например, АНАЭРОБНЫЕ ИНФЕКЦИИ. В результате иерархическое дерево понятия БАКТЕРИАЛЬНЫЕ БОЛЕЗНИ ЖИВОТНЫХ приобретает вид: 

    БАКТЕРИАЛЬНЫЕ БОЛЕЗНИ ЖИВОТНЫХ

с бактериозы животных

В1 инфекционные болезни животных

Н1 анаэробные инфекции

Н2 клостридиозы

НЗ ботулизм

Н1 бруцеллез

Н1 вибриоз

    Н1 гемофильные инфекции

       В приведенной иерархической классификации дескриптор ИНФЕКЦИОННЫЕ БОЛЕЗНИ ЖИВОТНЫХ является вышестоящим (метка В) по отношению к дескриптору БАКТЕРИАЛЬНЫЕ БОЛЕЗНИ ЖИВОТНЫХ, а термины с меткой Н - нижестоящими по отношению к нему. Цифры при метках отражают все уровни иерархических отношений между заглавным дескриптором словарной статьи и дескрипторами более широкими (вышестоящими) и узкими (нижестоящими).

      В словарной статье дескриптора его вышестоящие дескрипторы являются вершинами, с которыми он входит в соответствующие иерархические деревья. Один и тот же дескриптор может входить в разные деревья (пример 1), и находиться на разных вершинах иерархии одного и того же дерева (пример 2). Понятия, состоящие в родовидовых отношениях, не должны находиться на одном уровне иерархии. Максимальная глубина иерархии в тезаурусе БД АГРОС - 6 уровней.

      Пример 1

          ЛЮПИН 

               В1 алкалоидные культуры

                                                 В2 технические культуры

                                              В1 бобовые травы

                  В2 кормовые травы

           ВЗ кормовые культуры

      В1 зернобобовые культуры

      В1 ядовитые растения

      а сидераты 

    Пример 2

        ГОРНОАЛТАЙСКИЕ ОВЦЫ 

        В1 тонкорунные овцы

      В2 породы овец

    В1 мясо-шерстные овцы

        В2 породы овец 
         

     Иерархическая связь имеет двунаправленный характер. Это значит, что если между двумя ЛЕ установлены отношения типа «род-вид», «выше-ниже» и т. п., то обратной ссылкой для отношения «вид» будет «род» и наоборот: 

    ягодные культуры клубника

    Н1 клубника В1 ягодные культуры 

      Непротиворечивость     связей      отслеживается      в компьютерной форме тезауруса программными средствами.

      Отметим, что иерархические отношения, устанавливаемые между дескрипторами тезауруса, не претендуют на всеобщую применимость, их реализация отвечает задачам поиска информации конкретных областей знания. В связи с такой концепцией тезауруса, признано нецелесообразным строить иерархические деревья очень широких понятий как, например, СЕЛЬСКОЕ ХОЗЯЙСТВО, БОЛЕЗНИ ЖИВОТНЫХ и др., т. к. очевидна практическая узкая специализация пользователей или по отраслям сельского хозяйства, или по видам заболеваний животных и т. п. В тезаурусе такие широкие понятия связаны с более узкими терминами не иерархическими, а другими логическими отношениями - ассоциативными. 

Пример: 

    болезни животных

    а акушерские болезни

    а аллергические болезни

    а бесплодие животных

    а болезни внутренних органов и систем

а хирургические болезни

а экзотические болезни

      Такие широкие дескрипторы как БОЛЕЗНИ ЖИВОТНЫХ следует использовать    только для индексирования документов общего характера, например, монографий, учебников, справочников и т. п., поиск по этому дескриптору из-за отсутствия иерархической связи с более узкими дескрипторами не будет эффективным - пользователь получит только часть документов.

      При разработке тезауруса не ставятся чисто классификационные цели - иерархические деревья в нем формируются с целью создания средств для автоматизированного расширения ПОД или запроса.

Информация о работе Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля