Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля

Автор работы: Пользователь скрыл имя, 06 Сентября 2011 в 11:27, дипломная работа

Описание работы

Целью исследования является обоснование структуры лингвистического обеспечения научных сельскохозяйственных библиотек, способствующей максимально полному удовлетворению информационных потребностей ученых и практиков в релевантной информации по вопросам АПК.

Содержание работы

Введение - 3 -
Глава 1. Теоретические аспекты лингвистического обеспечения автоматизированных библиотечно-информационных систем. - 9 -
1.1. Понятие, состав и требования к современному лингвистическому обеспечению - 9 -
1. 2. Обзор лингвистического обеспечения сельскохозяйственных библиотек России и Украины - 17 -
1.2.2. Средства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук - 22 -
Глава 2. Структура лингвистических средств Белорусской сельскохозяйственной библиотеки им. И. С. Лупиновича Национальной академии наук Беларуси - 28 -
2.1. База данных УДК и ее применение в качестве информационно-поискового языка - 30 -
2.2. Тезаурус по сельскому хозяйству и продовольствию - 39 -
2.2.1. Назначение и структура тезауруса - 39 -
2.2.2. Парадигматические отношения - 45 -
2.2.3. Использование тезаурусов - 54 -
2.3. Проблема выбора средств лингвистического обеспечения и их интеграции в библиотеках АПК. - 58 -
Заключение - 62 -
Приложение №1…………………………………………

Файлы: 1 файл

DIPLOM.doc

— 855.00 Кб (Скачать файл)

 Методика формирования структуры лингвистического обеспечения ИПС включает несколько этапов:

  1. анализ задач, стоящих перед библиотекой, ее функций и библиотечно-библиографических процессов. Задачи определяют функции, которые реализуются технологиями. Выявление библиотечно-библиографических процессов позволяет определить лингвистические средства, требуемые для их обеспечения;
  2. изучение роли и функций ИПЯ в ИПС. Ознакомление с теорией лингвистического обеспечения позволяет понять назначение и роль ИПЯ в формировании и структурировании информационных массивов, в аналитико-синтетической обработке информации, информационном поиске и т. д.
  3. анализ эффективности использования собственных ИПЯ позволяет понять, как уже используемые в библиотеке информационно-поисковые языки обеспечивают автоматизированные библиотечно-библиографические процессы, наметить пути совершенствования и адаптации их к автоматизированной ИПС;
  4. изучение существующих отраслевых ИПЯ. В случае, если собственные ИПЯ не обеспечивают эффективное функционирование ИПС (эффективный информационный поиск), изучение структуры и поисковых возможностей, методических пособий отраслевых и м других ИПЯ позволит определить, подходят ли они данной ИПС;
  5. создание структуры лингвистического обеспечения: подбор ИПЯ, определение: функций каждого ИПЯ в структуре с учетом внутрибиблиотечных процессов и существования библиотеки в едином информационном пространстве отрасли;
  6. адаптация выбранных лингвистических средств к условиям ИПС; проведение работ, обеспечивающих использование ИПЯ в ИПС и выполнение правил работы с ними, усовершенствование ИПЯ с целью повышения эффективности их использования, разработка методических пособий.
 

Модель структуры ЛО должна основываться на практической значимости и научной обоснованности ценности каждого ИПЯ в ИПС. Применение ИПЯ, которые не используются в автоматизированной системе, может быть оправдано только их использованием для другого рода тематического поиска. 

Структура лингвистических средств ЦНСХБ в соответствии с ее оптимизированной моделью выглядит так: 

Внутрибиблиотечный уровень:

  • язык библиографического описания (для идентификации документов и информационного поиска по полям коммуникативного формата):
  • УДК (для индексирования входного документного потока);
  • Отраслевые рубрикаторы (для индексирования входного документного потока и тематического поиска в БД; структурирования информационных массивов; формирования текущих библиографических и реферативных изданий; определения тематического диапазона библиотечных фондов ЦНСХБ);
  • Информационно-поисковый тезаурус (используется для индексирования входного документного потока и тематического поискав БД; создания терминологической базы по сельскому хозяйству и продовольствию);
  • Язык ключевых слов (для индексирования входного документного потока и тематического поиска в БД; отбора лексики в информационно-поисковый тезаурус по сельскому хозяйству и продовольствию);
 
 
 
 

Межбиблиотечный уровень:

  • УДК (в корпоративной каталогизации и АСОД, а также в качестве международного информационного языка);
  • Язык ключевых слов (в корпоративной каталогизации и АСОД и для идентификационного поиска информации в БД страны);
  • Отраслевые рубрикаторы (как язык-посредник межотраслевого информационного общения, для обмена информацией и ее поиска в ИПС РФ и других стран СНГ, а также в качестве общеотраслевого ИПЯ АПК);
  • Информационно-поисковый тезаурус (как терминообраза АПК, а также в качестве

общеотраслевого ИПЯ АПК).

 На примере оптимизации структуры лингвистических средств Центральной научной сельскохозяйственной библиотеки видно, что составе ее лингвистических средств целесообразно оставлять только те информационно-поисковые языки, которые будут использоваться в автоматизированном поиске. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

 1. 2. Обзор лингвистического обеспечения сельскохозяйственных библиотек России и Украины. 

 1.2.1. Средства лингвистического обеспечения Центральной научной сельскохозяйственной библиотеки Российской сельскохозяйственной академии.

  Задача лингвистических средств — обеспечить не только быстрый, но эффективный поиск, предоставляющий максимально полно релевантную информацию по запросу пользователя. Автоматизированные системы обычно обеспечивают поиск текущей информации, в то время ретроспективную информацию пользователю приходится искать традиционным способом в карточных каталогах. Таким образом , ИПС библиотек сегодня включают электронные каталоги, базы данных и карточные каталоги. Эффективное использование информационно-библиотечной системы предполагает взаимосвязи составляющих ее компонентов, тесного взаимодействия всех библиотечных процессов. Нельзя забывать, что значительная часть библиотечных документов отражена только в карточных каталогах. В ЦНСХБ Россельхозакадемии в карточном комплексно-системном каталоге свыше 6 млн. карточек, а в электронном — около 1 млн. записей. Структура лингвистических средств ЦНСХБ включает ИПЯ, используемые, как при автоматизированном, так и при традиционном поиске. В состав лингвистических средств входят классификационные и дескрипторные ИПЯ. Вот основные.

Классификационные языки:

  1. Схема комплексно-системного каталога (КСК)
  2. Отраслевой рубрикатор по сельскому хозяйству и продовольствию (ОР),
  3. Универсальная десятичная классификация (УДК).

Дескрипторные языки:

  1. Информационно-поисковый тезаурус по сельскому хозяйству и продовольствию (ИПТ),
  2. язык ключевых слов.

    Ретроспективный поиск традиционным путем ведется по карточному комплексно-системному каталогу (КСК), строящемуся по классификационной схеме КСК, текущий поиск ведется по электронному каталогу (ЭК) и БД «AGROS». В процессе аналитико-синтетической обработки, на все документы, поступающие в фонд библиотеки, проставляются: систематизация КСК, индексы УДК, рубрики Отраслевого рубрикатора, дескрипторы ИПТ и ключевые слова. Т. е. в ЭК и БД  «AGROS» вводится информация на всех ИПЯ, используемых в ЦНСХБ. От индексаторов, создающих поисковый образ документа (ПОД), требуется знание всех ИПЯ, что создает повышенную нагрузку на них. Ведение, поддержка и разработка ИПЯ требуют огромных трудозатрат. Использование нескольких ИПЯ объясняется, с одной стороны, тем, что каждый из них выполняет свою функцию в ИПС, а с другой стороны, аксиомой, гласящей, что не существует идеального единого ИПЯ, выполняющего одновременно все функции лингвистических средств и обеспечивающего все информационные задачи, решаемые ИПС.

   Каждый ИПЯ предназначен для удовлетворения определенных информационных нужд и поисковых задач. Кроме того, использование нескольких ИПЯ помогает в некоторой степени решить проблему совместимости ЛО разных ИПС, поскольку предполагает, что один из используемых в ИПС ИПЯ знаком пользователю, что значительно облегчает для него поиск в ней. Этим объясняется, что некоторые библиотеки не только не сокращают, а наоборот расширяют состав своих лингвистических средств. Примером этому служит ГПНТБ, которая ввела в состав своих лингвистических средств Классификацию Дьюи, поскольку она используется во многих американских библиотеках. Но все ли ИПЯ используются при поиске текущей информации в автоматизированной системе ЦНСХБ?

 Отраслевой Рубрикатор по сельскому хозяйству и продовольствию (ОР), разработан на основе Государственного Рубрикатора научно-технической информации (ГРНТИ). Его назначение: структурировать информационные массивы, полно и точно отражать политематический поток документов, поступающих на ввод в ЭК и БД «AGROS», обеспечить полноту и точность информационного поиска, удовлетворять требованиям сортировки массивов документов при создании различных информационных продуктов, выполнять формально-логический контроль рубрик вводимых документов. ОР выполняет функции ЛО информационных изданий: текущих библиографических и реферативных журналов. ОР используется при тематическом поиске и формировании больших информационных массивов, комплектовании фонда, определяя его тематический диапазон, при индексировании документов. Пять уровней иерархии обеспечивают достаточно глубокий тематический поиск.

     Использование ГРНТИ во всех информационных центрах РФ позволяет использовать ОР в качестве межсистемного языкового средства, обеспечивающего взаимодействие как на отраслевом, так и на межотраслевом уровне. С его помощью возможен обмен информацией, поиск в различных ИПС.

    Информационно-поисковый тезаурус по сельскому хозяйству и продовольствию (ИПТ) разрабатывается в ЦНСХБ с 1992 г., за основу взят тезаурус ВНИИТЭИагропром. Терминологическая база содержит свыше 20 тыс. терминов, включающих все отрасли АПК и смежные с ним области, охрану окружающей среды и т. д. Используется при индексировании документов в ходе аналитико-синтетической обработки документов и при поиске информации в ЭК и БД «AGROS». В автоматизированной ИПС ЦНСХБ осуществляется процедура автоматического приписывания вышестоящих терминов, что обеспечивает полноту тематического поиска. Назначение ИПТ — отражение терминологической лексики отрасли, отражении парадигматических отношений, существующих между лексическими единицами-терминами, используемыми в сельскохозяйственной науке и практике, в обеспечении контроля и нормализации отраслевой лексики и единообразном, формализованном ее представлении в БД «AGROS» и ЭК ЦНСХБ. ИПТ выполняет функцию терминологического справочника АПК.

     Язык ключевых слов используется в ЦНСХБ с 1992 г. при индексировании документов и информационном тематическом поиске. Ключевые слова — слово или словосочетание из текста документа, несущие наибольшую смысловую нагрузку в нем. Язык ключевых слов — это нормализованная лексика; ключевые слова записываются индексатором в процессе аналитико-синтетической обработки документа в соответствии с правилами, разработанными в библиотеке. Язык ключевых слов дополняет ИПТ, позволяя осуществлять максимально полный тематический поиск. Ключевые слова являются терминологическим резервом лексики ИПТ, из которой после соответствующей лексической обработки в ИПТ вводятся новые дескрипторы и создаются новые словарные статьи.

      Универсальная десятичная классификация (УДК) — используется в ЦНСХБ с 1963 г. УДК является международной классификацией, используемой более чем в 60 странах мира. Все документы, поступающие в фонд ЦНСХБ, сопровождаются систематизацией по УДК, которая вводится в ЭК и БД «AGROS». Однако в качестве ИПЯ используется только для фонда открытого доступа книг и справочного фонда. До 1992 г. систематизация УДК печаталась на каталожных карточках ЦНСХБ, которые распространялись по системе Централизованной библиографической информации (ЦБИ) по библиотекам отрасли. Большинство библиотек отрасли строят карточные систематические каталоги по отраслевым таблицам УДК. Карточки ЦБИ выполняли функции централизованной каталогизации и систематизации; готовые каталожные карточки использовались для пополнения каталогов и картотек. Далеко не все сельскохозяйственные библиотеки уже оснащены компьютерами, карточные каталоги остаются для них единственным средством тематического поиска, а те, кто автоматизировал уже обработку документов и создает ЭК, продолжают использовать УДК наряду с ключевыми словами в качестве ИПЯ. Пока поиск по УДК не очень эффективен, но создаются авторитетные файлы УДК, электронные таблицы классификации, разрабатываются технологии приспособления этого ИПЯ для автоматизированного поиска. Вопрос о централизованной обработке документов актуален, возможно его решение на качественно новом уровне: информацию можно получать по запросу в электронной форме на дискете или по электронной почте, а затем использовать либо в ЭК, либо, распечатав в виде карточек, в карточных каталогах. Принимая во внимание, что УДК используется не только во многих зарубежных странах, странах СНГ, но и во всех технических библиотеках РФ, этот ИПЯ остается перспективным с точки зрения использования его в автоматизированном поиске, поэтому ЦНСХБ продолжает использовать его в своей ИПС.

    Комплексно-системный каталог (КСК) существует с 1935 г., долгое время он был единственным средством тематического поиска в ЦНСХБ. Его схема сочетает в себе принципы предметного и систематического каталогов. Разделы КСК включают предметные рубрики, расположенные в алфавитном порядке, внутри рубрик материал размещен в систематическом порядке. Отличительной чертой КСК от прочих каталогов является то, что он собирает в комплексе всю (книжную и статейную) информацию по какому-либо вопросу. В этом смысле он приближен к базам данных. Расположение документов в подрубриках в обратнохронологическом порядке делает его удобным для пользователя, предпочитающего в первую очередь знакомиться с последними документами, вышедшими по интересующему его предмету. Объем КСК составляет свыше 6 млн. карточек. В 1999 г. каталог законсервирован, это означает, что в него сегодня вливаются карточки на документы, изданные до 1999 г., которые продолжают поступать в фонд библиотеки. Таким образом, для текущего тематического поиска каталог закрыт.

      С 1992 г. в ЦНСХБ создается электронный каталог и с 1992 по 1998 гг. в библиотеке параллельно велись карточный и электронный каталоги, что требовало больших трудозатрат. Это объясняется необходимостью адаптировать пользователя к автоматизированной ИПС, научить его работать с ЭК и БД «AGROS». Кроме того, требовалось оснастить читательскую зону необходимым количеством ПЭВМ. Решение о консервации КСК было принято на основе того, что пользователь уже приобрел необходимые навыки работы с ЭК и БД «AGROS», может самостоятельно, либо с помощью посредника (дежурного библиографа) формировать тематический запрос и вести поиск в автоматизированном режиме. С консервацией КСК встает вопрос об использовании схемы КСК в качестве ИПЯ автоматизированной ИПС, о необходимости систематизации по КСК текущего входного документального потока и ввода ее в ЭК и БД «AGROS». КСК остается основным средством тематического ретроспективного поиска и, в этом смысле он должен и будет поддерживаться (редактироваться и т. д.). Однако в библиотеке начался процесс ретроконверсии карточных каталогов, который пока идет медленно, но работа началась и, главное, будет продолжаться. Это, вероятно, сократит количество обращений пользователей к карточному каталогу. В ходе ретроконверсии систематизация КСК используется как важный источник раскрытия содержания документа, но она трансформируется и термины из систематизации записываются в поля “дескрипторы” и “ключевые слова”. [59, C. 25-26]

    Проведенные в библиотеке исследования по эффективности тематического поиска показали, что поиск по систематизации КСК, записанной в традиционном виде, невозможен, поскольку запись систематизации содержит точки, тире, цифры, которые автоматизированная система не может распознать и идентифицировать из-за отсутствия схемы КСК в электронном виде.

Информация о работе Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля