Автор работы: Пользователь скрыл имя, 06 Сентября 2011 в 11:27, дипломная работа
Целью исследования является обоснование структуры лингвистического обеспечения научных сельскохозяйственных библиотек, способствующей максимально полному удовлетворению информационных потребностей ученых и практиков в релевантной информации по вопросам АПК.
Введение - 3 -
Глава 1. Теоретические аспекты лингвистического обеспечения автоматизированных библиотечно-информационных систем. - 9 -
1.1. Понятие, состав и требования к современному лингвистическому обеспечению - 9 -
1. 2. Обзор лингвистического обеспечения сельскохозяйственных библиотек России и Украины - 17 -
1.2.2. Средства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук - 22 -
Глава 2. Структура лингвистических средств Белорусской сельскохозяйственной библиотеки им. И. С. Лупиновича Национальной академии наук Беларуси - 28 -
2.1. База данных УДК и ее применение в качестве информационно-поискового языка - 30 -
2.2. Тезаурус по сельскому хозяйству и продовольствию - 39 -
2.2.1. Назначение и структура тезауруса - 39 -
2.2.2. Парадигматические отношения - 45 -
2.2.3. Использование тезаурусов - 54 -
2.3. Проблема выбора средств лингвистического обеспечения и их интеграции в библиотеках АПК. - 58 -
Заключение - 62 -
Приложение №1…………………………………………
– полезность его для поиска информации,
– наличие в терминологических стандартах,
– точность и однозначность термина,
– краткость и понятность его.
Отобранная терминология редактируется и дополняется терминами из различных справочных изданий (сельскохозяйственной энциклопедии, ветеринарной энциклопедии, ветеринарного энциклопедического словаря, терминологических словарей, учебников, монографий, справочников, ГОСТов).
Отобранные и отредактированные термины (лексические единицы) объединяются в классы условной эквивалентности с последующим делением на дескрипторы и аскрипторы.
Далее
описываются средства лингвистического
обеспечения БелСХБ (Информационно-поисковый
тезаурус по сельскому
хозяйству и продовольствию
и БД УДК), т. к. они наиболее широко
используются в библиотеках АПК.
2.1. База
данных УДК и ее применение в качестве
информационно-поискового языка.
Универсальная десятичная классификация (УДК) – наиболее разработанная международная комбинационная иерархическая классификационная система, которая широко используется во всем мире для индексирования различных видов документов, организации как традиционных, так и электронных каталогов, для поиска документов в информационно-поисковых системах.
УДК отвечает наиболее существенным требованиям, предъявляемым к классификационным системам: международности, универсальности, мнемоничности, возможности отражения новых достижений науки и техники без каких-либо серьезных изменений в ее структуре. В УДК весь универсум информации (все зарегистрированные знания) рассматривается в качестве целостной системы, все разделы которой органично связаны между собой.
Универсальная десятичная классификация является весьма гибкой и эффективной системой для организации библиографических записей на все виды информации на любых носителях. УДК построена таким образом, что новые события и новые области знания могут быть легко в ней учтены. Сам код не зависит от какого-либо конкретного языка (он состоит из арабских цифр и часто используемых знаков препинания).
Широкое
использование УДК в качестве
международной
Универсальная десятичная классификация является основой систематизации накопленных человечеством знаний в библиотеках, базах данных и других хранилищах информации. Она принята для индексирования научно-технических документов в большинстве стран мира и была опубликована в целом или частично на 39 различных языках. На английском языке она широко используется как в англоязычных странах, так и в тех, где английский является одним из официальных и рабочих языков (Британские острова, Канада, Австралия, Новая Зеландия, Индия, ряд африканских стран). Печатные издания существуют в размере карманных изданий (например, французское, английское издания), в стандартной версии (например, испанское, французское, английское издания) или расширенной версии (например, русское издание). Существуют и электронные версии, также доступные на разных языках и в различных форматах.
В России УДК является обязательным реквизитом всей книжной продукции и информации по естественным и техническим наукам.
В
нашей стране Универсальная десятичная
классификация используется в качестве
классификационной системы при организации
справочно-информационных фондов и каталогов
в органах научно-технической информации,
научных, специальных и технических библиотеках,
Национальной книжной палате, издательствах,
в библиотеках высших учебных заведений
технического, сельскохозяйственного
и медицинского профиля.
Машиночитаемый
эталон УДК
Одним из первых мероприятий Консорциума УДК, созданного для развития и совершенствования Универсальной десятичной классификации на современном этапе, стало создание международной базы данных, которая могла стать основой для всех изданий УДК – это машиночитаемый эталон УДК (Master Reference File – MRF).
MRF представляет собой базу данных, которая содержит таблицы УДК вместе с отчетами, необходимыми для управления, обслуживания и архивирования. Он содержит окончательную утвержденную версию УДК и функционирует в качестве рабочего инструмента для Консорциума УДК (УДКК), который создал и ведет базу данных для управления содержанием УДК, для определения потребностей и приоритетов для изменений, а также для того, чтобы отслеживать все изменения во времени.
Дубликат базы данных используется для регулярного технического обслуживания и обновления в течение года. После завершения он используется для создания нового MRF каждый год (в период декабрь / январь). Новая версия MRF, содержащая изменения за этот год, используется для распространения среди членов Консорциума и держателей лицензии.
Пользователи – не издатели – могут также воспользоваться прямым доступом к MRF, независимо от того, для каких целей им это необходимо: классификации, научных исследований или для других целей.
Консорциум УДК разрешает доступ (по лицензии) к базе данных MRF, с тем чтобы способствовать созданию различных программных приложений, направленных на отображения и обработку таблиц УДК, или использовать их в других приложениях. УДКК всегда готов обсудить такие случаи и готов вести переговоры для активного сотрудничества.
База данных MRF была разработана с помощью программного пакета ЮНЕСКО CDS/ISIS, который поддерживает международные стандарты обмена библиографическими данными в формате ИСО-2709. CDS/ISIS является международно-признанной информационно-поисковой программой, очень популярной из-за ее низкой стоимости, стабильности и адаптивности. Хотя у нее нет особых требований, когда дело доходит до компьютерной обработки и памяти, она способна обработать большое количество данных и имеет очень надежный поиск и сортировку объектов. Кроме того, программа доступна для разных платформ (DOS, Windows, UNIX) и постоянно совершенствуется.
Данные из MRF могут быть экспортированы как в формате ИСО-2709, так и в формате обычного текста, а также могут быть использованы в любом другом ИСО-2709-совместимом приложении или дополнительно отформатированы для печати, издательских целей и др.
По соображениям эффективности (с точки зрения затрат и времени) размер MRF-базы ограничивается приблизительно размером средних изданий УДК, какими они были известны до начала 1990-х годов.
База данных MRF потенциально может быть многоязычной, но в настоящее время распространяется только на английском языке, хотя с конца 1980-х годов существуют неполные версии на немецком и французском языках. Английский остается рабочим языком Консорциума.
Каждый индекс УДК в базе данных MRF, включая основные и вспомогательные определители, проходит в отдельном отчете. Каждый кусок данных, имеющих отношение к индексу УДК, его значению, регистрации, отображения, источнику или применению, вводится в отдельном поле (поля в CDS/ISIS не ограничены, и длина каждой области может составлять, где это необходимо, несколько подполей). Одна запись в MRF состоит из 30 областей, сгруппированных в две категории. Первые двадцать полей носят описательный характер и отражают фактическое содержание этих индексов УДК, остальные десять – это административные данные, которые содержат информацию, имеющую отношение к обслуживанию базы данных.
Есть три
базы данных, содержащие записи MRF:
1) MRF - содержит
наиболее актуальную версию машиночитаемого
эталона, включая самые последние официально
разрешенные дополнения и другие изменения,
за исключением аннулирований. Эта база
данных постоянно обновляется, но не распространяются,
за исключением особых случаев. MRF является
основной базой данных и используется
для поддержания текущего состояния.
2) MRFCAN –
содержит аннулированные индексы. В настоящее
время эта база содержит все официально
санкционированные отмененные после 1993
года индексы. Каждая запись содержит
административные данные с указанием
даты и источника списания (например, номер
«Дополнений и исправлений к УДК», в которых
публикуются аннулирования).
UMRF – распределенная
версия MRF, которая состоит из записей,
экспортируемых из главных базы данных
без административных областей. Каждый
год, вскоре после публикации «Дополнений
и исправлений к УДК» и обновления MRF, версии
UMRF «замораживается» и распространяется
среди подписчиков. Эти «замороженные»
версии существуют за каждый год с 1993 года.
Master Reference
File
Master Reference File сохраняется в штаб-квартире Консорциума УДК в Королевской библиотеке в Гааге. Он обновляется один раз в год в декабре/январе, включая изменения и поправки, опубликованные в «Дополнениях и исправлениях к УДК», как правило, опубликованных в ноябре прошлого года в печатном виде (и в электронной форме, начиная с 2002 года). В дополнение к обновленной базе данных MRF каждому пользователю предоставляются отдельные файлы (как текстовые, так и ИСО), содержащие новые индексы, изменения и замены, которые уже включены в текущую версию на этот год. Инструкции по редактированию и управлению базой данных также включены. Руководство по применению Master Reference File, называемое «Руководство к MRF», является бесплатным для всех членов Консорциума и держателей лицензии.
База
данных в своей последней модификации
в 2007 году содержит 67770 индексов УДК и имеет
размер около 15000 килобайт. Распределение
записей в соответствии с разделом и предметными
областями выглядит следующим образом
(обновлено в июле 2008 года):
Индекс
Описание (сокращенное)
Ia/к Общие вспомогательные 12993
в том числе:
Ic Язык 1364
Id Форма 362
Ie Место 9384
If Этнические 33
Ig Время 284
Ik Свойства 805
Ik Материалы 152
Ik Процессы 333
Ik Лица 267
Основная таблица 54777
в том числе:
0 Общий отдел ... 1800
1 Философия. Психология 824
2 Религия 2419
3 Общественные науки 6813
в том числе:
30/32 Общественные науки в целом. Статистика.
Социология. Демография. Политика 962
33 Экономика 2004
34 Право 1826
35 Государственное управление… 1010
36 Общественное благосостояние 581
37 Образование 234
39 Фольклор. Этнографии 194
5 Математика. Естественные науки 11176
в том числе:
50 Науки об окружающей среде 49
51 Математика 1033
52 Астрономия 625
53 Физика 1846
54 Химия. Минералогические науки 3305
55 Науки о Земле 1497
56/59 Палеонтологии. Биологические науки 2820
6 Прикладные
науки. Медицина. Техника