Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля

Автор работы: Пользователь скрыл имя, 06 Сентября 2011 в 11:27, дипломная работа

Описание работы

Целью исследования является обоснование структуры лингвистического обеспечения научных сельскохозяйственных библиотек, способствующей максимально полному удовлетворению информационных потребностей ученых и практиков в релевантной информации по вопросам АПК.

Содержание работы

Введение - 3 -
Глава 1. Теоретические аспекты лингвистического обеспечения автоматизированных библиотечно-информационных систем. - 9 -
1.1. Понятие, состав и требования к современному лингвистическому обеспечению - 9 -
1. 2. Обзор лингвистического обеспечения сельскохозяйственных библиотек России и Украины - 17 -
1.2.2. Средства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук - 22 -
Глава 2. Структура лингвистических средств Белорусской сельскохозяйственной библиотеки им. И. С. Лупиновича Национальной академии наук Беларуси - 28 -
2.1. База данных УДК и ее применение в качестве информационно-поискового языка - 30 -
2.2. Тезаурус по сельскому хозяйству и продовольствию - 39 -
2.2.1. Назначение и структура тезауруса - 39 -
2.2.2. Парадигматические отношения - 45 -
2.2.3. Использование тезаурусов - 54 -
2.3. Проблема выбора средств лингвистического обеспечения и их интеграции в библиотеках АПК. - 58 -
Заключение - 62 -
Приложение №1…………………………………………

Файлы: 1 файл

DIPLOM.doc

— 855.00 Кб (Скачать файл)

   – полезность его для поиска информации,

   – наличие в терминологических  стандартах,

   – точность и однозначность термина,

   – краткость и понятность его.

   Отобранная  терминология редактируется и дополняется  терминами из различных справочных изданий (сельскохозяйственной энциклопедии, ветеринарной энциклопедии, ветеринарного  энциклопедического словаря, терминологических  словарей, учебников, монографий, справочников, ГОСТов).

   Отобранные  и отредактированные термины (лексические  единицы) объединяются в классы условной эквивалентности с последующим  делением на дескрипторы и аскрипторы.

      Далее описываются средства лингвистического обеспечения БелСХБ (Информационно-поисковый тезаурус по сельскому хозяйству и продовольствию и БД УДК), т. к. они наиболее широко используются в библиотеках АПК.  
 
 
 
 
 
 
 
 

2.1. База данных УДК и ее применение в качестве информационно-поискового языка. 

      Универсальная десятичная классификация (УДК) – наиболее разработанная международная комбинационная иерархическая классификационная система, которая широко используется во всем мире для индексирования различных видов документов, организации как традиционных, так и электронных каталогов, для поиска документов в информационно-поисковых системах.

УДК отвечает наиболее существенным требованиям, предъявляемым  к классификационным системам: международности, универсальности, мнемоничности, возможности  отражения новых достижений науки и техники без каких-либо серьезных изменений в ее структуре. В УДК весь универсум  информации (все зарегистрированные знания) рассматривается в качестве целостной системы, все разделы которой органично связаны между собой.

Универсальная десятичная классификация является весьма гибкой и эффективной системой для организации библиографических записей на все виды информации на любых носителях. УДК построена таким образом, что новые события и новые области знания могут быть легко в ней учтены. Сам код не зависит от какого-либо конкретного языка (он состоит из арабских цифр и часто используемых знаков препинания).

      Широкое использование УДК в качестве международной классификационной  системы определяется ее технологическими свойствами: комбинационной структурой, развитой системой типизации, удобной индексацией. Возможности УДК как комбинационной системы заключаются в том, что она имеет развитую систему общих и специальных определителей.

  Универсальная десятичная классификация является основой систематизации накопленных человечеством знаний в библиотеках, базах данных и других хранилищах информации. Она принята для индексирования научно-технических документов в большинстве стран мира и была опубликована в целом или частично на 39 различных языках. На английском языке она широко используется как в англоязычных странах, так и в тех, где английский является одним из официальных и рабочих языков (Британские острова, Канада, Австралия, Новая Зеландия, Индия, ряд африканских стран). Печатные издания существуют в размере карманных изданий (например, французское, английское издания), в стандартной версии (например, испанское, французское, английское издания) или расширенной версии (например, русское издание). Существуют и электронные версии, также доступные на разных языках и в различных форматах.

      В России УДК является обязательным реквизитом всей книжной продукции и информации по естественным и техническим наукам.

      В нашей стране Универсальная десятичная классификация используется в качестве классификационной системы при организации справочно-информационных фондов и каталогов в органах научно-технической информации, научных, специальных и технических библиотеках, Национальной книжной палате, издательствах, в библиотеках высших учебных заведений технического, сельскохозяйственного и медицинского профиля. 

Машиночитаемый эталон УДК 

      Одним из первых мероприятий Консорциума УДК, созданного  для развития и совершенствования  Универсальной десятичной классификации на современном этапе, стало создание международной базы данных, которая могла стать основой  для всех изданий УДК – это машиночитаемый эталон УДК (Master Reference File – MRF).

MRF представляет собой базу данных, которая содержит таблицы УДК вместе с отчетами, необходимыми для управления, обслуживания и архивирования. Он содержит окончательную утвержденную версию УДК и функционирует в качестве рабочего инструмента для Консорциума УДК (УДКК), который создал и ведет базу данных для управления содержанием УДК, для определения потребностей и приоритетов для изменений, а также для того, чтобы отслеживать все изменения во времени.

      Дубликат базы данных используется для регулярного технического обслуживания и обновления в течение года. После завершения он используется для создания нового MRF каждый год (в период декабрь / январь). Новая версия MRF, содержащая изменения за этот год, используется для распространения среди членов Консорциума и держателей лицензии.

Пользователи – не издатели – могут также воспользоваться прямым доступом к MRF, независимо от того, для каких целей им это необходимо: классификации, научных исследований или для других целей.

      Консорциум УДК разрешает доступ (по лицензии) к базе данных MRF, с тем чтобы способствовать созданию различных программных приложений, направленных на отображения и обработку таблиц УДК,  или использовать их в других приложениях. УДКК всегда готов обсудить такие случаи и готов вести переговоры для активного сотрудничества.

      База данных MRF была разработана с помощью программного пакета ЮНЕСКО CDS/ISIS, который поддерживает международные стандарты обмена библиографическими данными в формате ИСО-2709. CDS/ISIS является международно-признанной информационно-поисковой программой, очень популярной из-за ее низкой стоимости, стабильности и адаптивности. Хотя у нее нет особых требований, когда дело доходит до компьютерной обработки и памяти, она способна обработать большое количество данных и имеет очень надежный поиск и сортировку объектов. Кроме того, программа доступна для разных платформ (DOS, Windows, UNIX) и постоянно совершенствуется.

Данные из MRF могут быть экспортированы как в  формате ИСО-2709, так и в формате обычного текста, а также могут быть использованы в любом другом ИСО-2709-совместимом приложении или дополнительно отформатированы для печати, издательских целей  и др.

По соображениям эффективности (с точки зрения затрат и времени) размер MRF-базы ограничивается приблизительно размером средних изданий УДК, какими они были известны до начала 1990-х годов.

      База данных MRF потенциально может быть многоязычной, но в настоящее время распространяется только на английском языке, хотя с конца 1980-х годов существуют неполные версии на немецком и французском языках. Английский остается рабочим языком Консорциума.

Каждый индекс УДК в базе данных MRF, включая основные и вспомогательные определители, проходит в отдельном отчете. Каждый кусок данных, имеющих отношение к индексу УДК, его значению, регистрации, отображения, источнику или применению, вводится в отдельном поле (поля в CDS/ISIS не ограничены, и длина каждой области может составлять, где это необходимо, несколько подполей). Одна запись в MRF состоит из 30 областей, сгруппированных в две категории. Первые двадцать полей носят описательный характер и отражают фактическое содержание этих индексов УДК, остальные десять – это административные данные, которые содержат информацию, имеющую отношение к  обслуживанию базы данных.

Есть три базы данных, содержащие записи MRF:  

1) MRF - содержит наиболее актуальную версию машиночитаемого эталона, включая самые последние официально разрешенные дополнения и другие изменения, за исключением аннулирований. Эта база данных постоянно обновляется, но не распространяются, за исключением особых случаев. MRF является основной базой данных и используется для поддержания текущего состояния.  

2) MRFCAN – содержит аннулированные индексы. В настоящее время эта база содержит все официально санкционированные отмененные после 1993 года индексы. Каждая запись содержит административные данные с указанием даты и источника списания (например, номер «Дополнений и исправлений к УДК», в которых публикуются аннулирования).  

UMRF – распределенная версия  MRF, которая состоит из записей, экспортируемых из главных базы данных без административных областей. Каждый год, вскоре после публикации «Дополнений и исправлений к УДК» и обновления MRF, версии UMRF «замораживается» и распространяется среди подписчиков. Эти «замороженные» версии существуют за каждый год с 1993 года.  

Master Reference File 

      Master Reference File сохраняется в штаб-квартире Консорциума УДК в Королевской библиотеке в Гааге. Он обновляется один раз в год в декабре/январе,  включая изменения и поправки, опубликованные в «Дополнениях и исправлениях к УДК», как правило, опубликованных в ноябре прошлого года в печатном виде (и в электронной форме, начиная с 2002 года). В дополнение к обновленной базе данных MRF каждому пользователю предоставляются отдельные файлы (как текстовые, так и ИСО), содержащие новые индексы, изменения и замены, которые уже включены в текущую версию на этот год. Инструкции по редактированию и управлению базой данных также включены. Руководство по применению Master Reference File, называемое «Руководство к MRF», является бесплатным для всех членов Консорциума и держателей лицензии.

      База данных в своей последней модификации в 2007 году содержит 67770 индексов УДК и имеет размер около 15000 килобайт. Распределение записей в соответствии с разделом и предметными областями выглядит следующим образом (обновлено в июле 2008 года):  
 
 
 
 
 
 
 
 
 
 

 

Индекс          Описание (сокращенное)                                   Количество в УДК

 

Ia/к               Общие вспомогательные      12993

в том числе:

Ic   Язык                    1364

Id   Форма           362

Ie  Место                9384

If  Этнические            33

Ig     Время           284

Ik   Свойства          805

Ik   Материалы          152

Ik   Процессы                      333

Ik   Лица                         267

 

      Основная таблица                  54777

в том числе:

0   Общий отдел ...                    1800  

1   Философия. Психология        824

2   Религия          2419  

3   Общественные науки         6813  

в том числе:

30/32   Общественные науки в целом. Статистика.

            Социология. Демография. Политика             962

33   Экономика          2004  

34   Право            1826  

35   Государственное управление…       1010  

36   Общественное благосостояние        581  

37   Образование            234  

39   Фольклор. Этнографии         194  

5   Математика. Естественные науки                   11176

в том числе:

50   Науки об окружающей среде                      49  

51    Математика           1033  

52   Астрономия            625  

53   Физика            1846  

54   Химия. Минералогические науки         3305  

55   Науки о Земле            1497  

56/59              Палеонтологии. Биологические науки        2820

6   Прикладные науки. Медицина. Техника                            27486

Информация о работе Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля