Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля

Автор работы: Пользователь скрыл имя, 06 Сентября 2011 в 11:27, дипломная работа

Описание работы

Целью исследования является обоснование структуры лингвистического обеспечения научных сельскохозяйственных библиотек, способствующей максимально полному удовлетворению информационных потребностей ученых и практиков в релевантной информации по вопросам АПК.

Содержание работы

Введение - 3 -
Глава 1. Теоретические аспекты лингвистического обеспечения автоматизированных библиотечно-информационных систем. - 9 -
1.1. Понятие, состав и требования к современному лингвистическому обеспечению - 9 -
1. 2. Обзор лингвистического обеспечения сельскохозяйственных библиотек России и Украины - 17 -
1.2.2. Средства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук - 22 -
Глава 2. Структура лингвистических средств Белорусской сельскохозяйственной библиотеки им. И. С. Лупиновича Национальной академии наук Беларуси - 28 -
2.1. База данных УДК и ее применение в качестве информационно-поискового языка - 30 -
2.2. Тезаурус по сельскому хозяйству и продовольствию - 39 -
2.2.1. Назначение и структура тезауруса - 39 -
2.2.2. Парадигматические отношения - 45 -
2.2.3. Использование тезаурусов - 54 -
2.3. Проблема выбора средств лингвистического обеспечения и их интеграции в библиотеках АПК. - 58 -
Заключение - 62 -
Приложение №1…………………………………………

Файлы: 1 файл

DIPLOM.doc

— 855.00 Кб (Скачать файл)

  Выбор лингвистического обеспечения библиотеки определяется задачами ее информационно-поисковой системы и информационными ресурсами, а также запросами ее пользователей. Именно их разнообразные потребности необходимо учитывать, планируя и создавая ЛС. ГНСХБ УААН использует как лингвистические средства несколько ИПМ параллельно. Это способствует быстрому и широкому доступу пользователей к информации наиболее известной им на информационно-поисковом языке.

      Для расширения возможностей поиска в ЭК библиотеки применяется предметный поиск, который является междисциплинарным, межотраслевым и комплексным. По такому запросу пользователи получают комплекс всех документов по предмету, проблемы, темы независимо от отраслей знаний, к которым относятся все эти документы. Основой для создания языка предметных рубрик стал перечень рубрик алфавитно-предметного указателя (АПП) в Список рубрик предметного каталога ГНСХБ УААН и Государственный стандарт Украины ГСТУ 25395-2000 (ISO 5963:1985) «Информация и документация. Обследование документа, установление его предмета и отбор терминов индексирования. Общая методика». [68]

Разнообразие  информационно-поисковых языков, которые составляют структуру лингвистических средств, объясняется типо-видовым разнообразием и тематической сложностью входного документного потока, традициями и особенностями Государственной научной сельскохозяйственной библиотеки, навыками работников и запросами пользователей библиотеки, а также тем, что ни одна из современных ИПМ не может в полном объеме обеспечить полноту и эффективность поиска релевантной информации. 

 Комплексное  применение ИПМ позволяет: 

 • наиболее  полно осуществлять обработку  политематической входного документного потока библиотеки для ввода его в БД;

 • обеспечить  точность информационного поиска;

 • удовлетворять требованиям сортировки массивов документов при создании различной исходной продукции, в т ч. текущих изданий;

 • выполнять формально-логический контроль рубрик документов, которые вводятся.

 Для этого  выявляются дублирующие или избыточные (неработающие) рубрики; проводится сравнительный анализ части рубрик ГПР с целью устранения многоаспектности, дублирование рубрик, унификации наименований; уточняется справочно-ссылочный аппарат, редактируются наименования рубрик, примечания.

С включением в  фонд и аналитико-синтетическую  обработку документов новой тематики (например, "Нанотехнологии", "Интеллектуальная собственность", "Экономические нормативы") создаются новые ПР, для которых разрабатываются схемы, создается ссылочной-справочный аппарат, приписываются комментарии и примечания. Затем этот раздел включается в машинный ГПР ЭК.

 Ведутся подготовительные  работы по организации Отраслевого тезауруса (ГТ): проводится отбор массива лексических единиц (ЛЕ) по всему диапазону входного потока БД, формируется словарь ОТ. Отбор ЛЕ осуществляется специалистами в ходе аналитико-синтетического обработки документов. ЛЕ поступают сначала в карточную картотеку и используются некоторое время как ключевые слова. Работа над ними состоит из нескольких этапов:

  1. мониторинг на частотность появления терминов в документах;
  2. согласование со специалистами,
  3. проверка в справочниках и тезаурусах, а также в зарубежных БД.

Впоследствии:

  1. проводится лингвистическая обработка;
  2. редакция;
  3. происходит построение статьи термина-дескриптора;
  4. проводится сверка с электронной рубрикой.

Все эти процессы позволяют выявлять ошибки индексирования и ввода информации в Отраслевой тезаурус. [70, C. 55-57]

В связи с  отсутствием в Украине единого научно-исследовательского, научно-методического и информационного центра по разработке и ведению лингвистических средств, библиотеки на практике сталкиваются с рядом сложных проблем не решенных на теоретическом уровне. Это, например, выбор ИПЯ. При организации электронного каталога неизбежно возникает вопрос: каким ИПЯ воспользоваться для раскрытия предметного содержания документа: языком предметных рубрик, языком ключевых слов или их сочетанием?

      Несмотря  на принципиальные различия этих языков, практика их применения осложняется из-за нерешенных проблем. Ни в теории предметизации, ни в теории координатного индексирования нет четких рекомендаций относительно выбора таких параметров, как длина лексической единицы (слово или словосочетание), постоянство словосочетаний, прямой или инверсированный порядок приведения ЛЕ в словосочетаниях т.д. На практике это влечет за собой невозможность сравнения результатов семантической обработки документов и запросов, снижает показатели полноты и точности информационного поиска.

      Проблема  нормализации лексических единиц усиливается  из-за того, что на практике нет средств  контроля лексики, в равной мере доступных всем библиотекам. Отсутствие информационно-поискового тезауруса, который бы поддерживался в рабочем состоянии, был пригоден для пополнения и внесения изменений, причем учитывал отраслевую специфику, существенно осложняет процесс координатного индексирования, а отдельные попытки их создания не решают этих проблем.

      Таким образом, определенность в подходах при решении проблем, первые шаги к координации усилий библиотек  разных систем и ведомств дают надежду  на более активные действия. Надо понимать, что каждая идея интеграции предусматривает  необходимость строгого соблюдения стандартов. Стандарты при интеграции библиотечно-информационных ресурсов содержат правила предъявления библиографических записей и правил взаимодействия библиотек при обмене записями.

  При создании единой информационно-библиографической среды следует учитывать ряд условий, а именно:

• полная совместимость  с международными форматами UNIMARC и UKRMARC на основе использования средств  импорта / экспорта данных;

 • разработка  технологии доступа с использованием WEB-технологий в объединенных ресурсов библиотек - участниц корпоративной системы каталогизации;

• разработка технологии доступа с использованием протокола Z39.50 к объединенным ресурсам библиотек;

 • разработка  технологии пополнения объединенных  ресурсов библиотек-участниц корпоративной системы каталогизации;

• создание возможности  для совместной работы библиотек - участниц региональной системы с библиотекой  государственного уровня;

 • вопросы  обеспечения форматной и лингвистической совместимости библиографических записей партнеров.

Кроме того, необходимо решать вопросы технического обеспечения (приобретение, тестирование и установка  оборудования; поддержка системы связи между участниками проекта), а также вопросы подготовки кадров в виде мероприятий по обучению разработанным новым технологиям персонала библиотек-участниц, проведения оперативного консультирования. [67, C. 32-35].

      Единое  ЛО сельскохозяйственных БД позволит создать единое информационное пространство отрасли. Наличие предметного рубрикатора, разработанного на основе Государственного рубрикатора научно-технической информации, который используется в отраслевых библиотеках, УДК и в дальнейшем Отраслевого тезауруса позволит улучшить качество индексирования документов, облегчит поиск в отраслевых БД.

  Согласно плану научной работы сектора и фундаментальной научной темы исследования библиотеки "Научные основы совершенствования информационно-библиотечного обеспечения аграрной отрасли" (№ гос. Регистрации 107U003106), утвержденной Экспертным советом при УААН (решение № 3 от 20.03.08 г.) ГНСХБ УААН проводит информационную научно-методическую работу с библиотеками области, организует семинары, курсы повышения квалификации по вопросам индексирования и работы с ИПЯ. В рамках этих мероприятий была разработана Инструкция "О порядке формирования предметных рубрик ЭК ДНСХБ УААН". В системе повышения квалификации работников сети все большую актуальность приобретает проблема расширения общей лингвистической (относительно информационно-поисковых языков) культуры библиотекарей, в том числе путем привлечения специалистов для проведения занятий по УДК. Это способствует профессиональному становлению библиотекаря качественно новой формации, для которого свободная ориентация в ресурсах глобальных сетей является неотъемлемым элементом профессиональной квалификации.

  Это сложная и трудоемкая работа может быть решена только коллективными усилиями. Только объединение библиотек сделает возможным создание библиотеки нового типа, которая бы соответствовала международному модельному стандарту деятельности и формировала новый взгляд общества на современное культурно-информационное учреждение.

      Работники ГНСХБ надеются что библиотеки области также примут участие в разработке статей тезауруса или в отборе лексики для него. Такая кооперация поможет не только созданию единого ЛО, единого информационного пространства, не только сократит финансовые затраты библиотек на разработку собственного ЛО, но и поможет повысить уровень индексирования документов по сельскому и лесному хозяйству.  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

 Глава 2. Структура лингвистических средств Белорусской сельскохозяйственной библиотеки им. И. С. Лупиновича Национальной академии наук Беларуси. 

      Успешное  функционирование современной научной  библиотеки во многом зависит от автоматизации  библиотечных процессов. Для БелСХБ внедрение системы автоматизации библиотек ИРБИС в 1995 году предоставило огромные возможности для эффективной работы библиотеки и качественного обслуживания пользователей.

До внедрения  ИРБИС в библиотеке использовалась АИБС МАРК, в которой были созданы два электронных каталога: книг и статей. Одновременно поддерживались все традиционные библиотечные технологии: читательские формуляры, ручные каталоги и картотеки и т. п.

      Внедрив ИРБИС, библиотека прекратила вести  карточные каталоги и картотеки и был создан единый электронный каталог, в котором представлены сведения о книгах, журналах, статьях, БД и др. Встроенные в ИРБИС внутренние словари и меню-справочники, формально-логический контроль части данных, а также автоматическая сверка на дублетность повысили качество электронного каталога. Т. к. система предложила большой выбор полей при описании документа, библиографическая запись стала более информативной. Автоматическое формирование словарей по мере ввода записей позволило реализовать быстрый поиск по всем элементам описания и их сочетаниям.

      Работа  в ИРБИС повлекла изменения и  в обслуживании пользователей: была создана БД читателей, внедрена технология автоматического формирования заказа на выдачу документов в электронном  каталоге и технология автоматического учета выдачи/возврата документов. АРМ «Читатель» обеспечил свободный доступ пользователя к электронному каталогу без участия библиотекаря.

      Внедрение системы создало предпосылки  для организации открытого доступа  пользователей к наиболее ценной и часто спрашиваемой части фонда БелСХБ с пометкой в электронном каталоге о местонахождении документа.

      Внедрение системы автоматизации библиотек  «ИРБИС» позволило расширить  набор лингвистических средств  в БелСХБ.

      Библиотека  одной из первых приобрела БД УДК, которая используется как автономно, так и встроенной в АРМ Каталогизатор в виде АПУ к УДК и БД УДК. В связи с тем, что в электронном каталоге поиск по линейному индексу невозможен, принято решение поисковый образ документа записывать простыми индексами УДК без знаков присоединения, т. е. координатами. В этом случае поиск записей по УДК ведется аналогично поиску по ключевым словам с использованием возможностей автоматизированной системы (логические операторы, усечение индексов справа и т. д.).

В библиотеке используется БД УДК на CD-ROM. Она является полным электронным изданием таблиц УДК и распространяется ГПНТБ России на основании лицензии ВИНИТИ. БД представлена в поисковом интерфейсе системы автоматизации библиотек ИРБИС. Каждая запись БД содержит индекс, наименование рубрики, ссылки и методические указания. Поиск в БД может быть осуществлен как по графу на полную глубину, так и по индексам отдельных таблиц и по ключевым словам. Интерфейс снабжен удобными средствами отбора индексов и построения конкретных индексов с последующим их переносом в библиографическую запись, созданную при помощи любой АБИС. 

   Крупным шагом в совершенствовании поискового образа документа ЭК БелСХБ стало  внедрение в процесс индексирования Информационно-поискового тезауруса  по сельскому хозяйству и продовольствию, созданного ЦНСХБ в 2002 г. Основным назначением электронной версии информационно-поискового тезауруса (ИПТ) научно-технических терминов по сельскому хозяйству является смысловая обработка документов и запросов для машинного поиска информации. ИПТ является отраслевым тезаурусом, в котором достаточно полно представлена лексика всех тематических разделов рубрики 68 (сельское и лесное хозяйство) Рубрикатора ГРНТИ, 65 (пищевая промышленность), а также с разной степенью охвата другие тематические разделы в части сельского хозяйства, пищевой и перерабатывающей промышленности.

   ИПТ постоянно  обновляется и корректируется. Выявление  и отбор терминологии проводится при индексировании документов по сельскохозяйственной тематике. В основу отбора терминов положены следующие критерии:  
       – частота появления термина в индексируемых документах и информационных запросах,

Информация о работе Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля