Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля

Автор работы: Пользователь скрыл имя, 06 Сентября 2011 в 11:27, дипломная работа

Описание работы

Целью исследования является обоснование структуры лингвистического обеспечения научных сельскохозяйственных библиотек, способствующей максимально полному удовлетворению информационных потребностей ученых и практиков в релевантной информации по вопросам АПК.

Содержание работы

Введение - 3 -
Глава 1. Теоретические аспекты лингвистического обеспечения автоматизированных библиотечно-информационных систем. - 9 -
1.1. Понятие, состав и требования к современному лингвистическому обеспечению - 9 -
1. 2. Обзор лингвистического обеспечения сельскохозяйственных библиотек России и Украины - 17 -
1.2.2. Средства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук - 22 -
Глава 2. Структура лингвистических средств Белорусской сельскохозяйственной библиотеки им. И. С. Лупиновича Национальной академии наук Беларуси - 28 -
2.1. База данных УДК и ее применение в качестве информационно-поискового языка - 30 -
2.2. Тезаурус по сельскому хозяйству и продовольствию - 39 -
2.2.1. Назначение и структура тезауруса - 39 -
2.2.2. Парадигматические отношения - 45 -
2.2.3. Использование тезаурусов - 54 -
2.3. Проблема выбора средств лингвистического обеспечения и их интеграции в библиотеках АПК. - 58 -
Заключение - 62 -
Приложение №1…………………………………………

Файлы: 1 файл

DIPLOM.doc

— 855.00 Кб (Скачать файл)

  Однако эти работы носят общий характер, трактующий лингвистическое обеспечение как неотъемлемую часть ИПС, но не касаются детального рассмотрения методики построения, ведения, использования и назначения лингвистических средств. Разработка теоретических и методологических проблем лингвистического обеспечения началась в 60-х годах, когда пришло понимание того, что без информационно-поисковых языков вычислительные машины остаются только машинами, и начался вслед за этапом «механическим» новый «логико-лингвистический», по определению А.В. Соколова, этап в развитии ИПС.

 Вопросы лингвистического обеспечения поднимаются, с разной степенью детализации, во всех трудах, касающихся ИПС, поскольку лингвистическое обеспечение является ее неотъемлемой частью. Это подчеркивают в своих работах Ю. М. Арский, Г. Г. Белоногов, В. А. Глинский, Б. А. Кузнецов, А. И. Михайлов, В. А. Мишин, В. В. Морозов, В. В. Попов, Я. Л. Шрайберг и др.

 Ранние разработки в области ИПЯ касались лингвистического обеспечения больших электронно-вычислительных машин и отражены в работах М. Г. Гаазе-Рапопорта, Р. Г. Котова, Б. В. Якушина, Л. Н. Пирумовой. Работы последних лет относятся к ИПС, работающим в диалоговых режимах на персональных компьютерах. Теоретические разработки проблемы лингвистического обеспечения автоматизированных ИПС касались в 60-70-х годах только информационных центров, что объясняется отсутствием автоматизации в библиотеках и библиотечно-библиографических процессах. Работы А. Б. Антопольского, Г. Г. Артаманова, Б. Р. Певзнера, А. В. Соколова, А. И. Черного послужили основой для дальнейшего развития теории лингвистического обеспечения ИПС. С развитием автоматизации библиотечно-библиографических процессов появились работы, посвященные развитию ИПЯ библиотечных ИПС. Проблемы лингвистических

средств для библиотечных технологий рассматриваются в трудах Л.И. Беневоленской, Е. М. Зайцевой, О. А. Фуралева, М. В. Экстрем и др.

 В работах Н. И. Гендиной обобщены и развиты принципы лингвистического обеспечения, описанные в трудах отечественных исследователей, в приложении к библиотечным технологиям, рассматривается широкий спектр вопросов, относящихся к лингвистическому обеспечению, в т.ч. индексированию, информационному поиску и т.д. Ряд научных разработок посвящен отдельным аспектам лингвистического обеспечения. Вопросы классификационных ИПЯ исследовались такими учеными, как Л. Н. Пирумова, М. А. Довбенко, Е. Н. Пименов, Ю. А. Шрейдер и др. Развитию Библиотечно-библиографической классификации (ББК) посвящен ряд работ Э. Р. Сукиасяна. Проблемы ведения, разработки, актуализации Универсальной десятичной классификации (УДК) отражены в работах О. А. Антошковой, Н. Д. Борисовой, А. В. Владимировой, О. В. Караджи, Б. В. Кристального, Л. В. Лобовой, Б.И. Маршака, Т. В. Тужилковой и др.

  Рубрикатору ГСНТИ посвящены работы В. Н. Белоозерова, И. Е. Гендлиной, Б.В. Кристального, Н. В. Лукашевич, В. М. Полонского, Ю.Ф. Тарасюк, З.М. Храпкина и др. С развитием и совершенствованием автоматизированных баз данных все большее внимание уделяется дескрипторным языкам. Методика создания информационно-поискового тезауруса содержится в работах О.А. Лавреновой, А.В. Соколова. Выявлению и обоснованию оптимальных путей развития дескрипторных языков посвящены труды Л. Н. Пирумовой, Л. П. Алексеевой, Д. Н. Бакун, С. А. Белькова, П. И. Браславского, С. Л. Гольдштейн, С. В. Еринева, В. М. Лейчик, С. А. Мамонтова, В. М. Масляковой, Л. И. Оранской, Т. Я. Ткаченко и др.

 ИПЯ непосредственно связаны с аналитико-синтетической обработкой информации, поскольку именно на этом этапе осуществляется перевод информации с естественного на искусственные языки и создается поисковый образ документа. Исследованиями в области аналитико-синтетической обработки информации занимаются теоретики и практики библиотековедения и информационной деятельности: Ф. С. Воройский, А. Ф. Еареев, В. В. Корнеев и др. В работах последних лет поднимаются проблемы автоматизированного индексирования, о них пишут Л. В. Кнорина, Н. Н. Литвинова, П.В. Лукашевич. Важное место в разработке лингвистического обеспечения ИПС отводится проблеме совместимости информационно-поисковых языков. Особенно важной и актуальной проблема совместимости ИПЯ становится в наши дни с развитием сетевых технологий, глобальной сети Интернет. Большой интерес, в этой связи, представляют груды А. В. Бобко, Р. С.Еиляревского, Т. Б. Грищенко, А. Ю. Евсюкова, Л. А. Жариковой, А. С. Калиновского. К). В. Ланграф, Н. В. Рябовой, Г. А. Скарук и др.

 В отличие от информационных центров, где информация хранится преимущественно в электронной форме, в библиотеке информация часто существует на бумажных носителях и наряду с электронными формами обслуживания применяются традиционные формы. Поэтому особый интерес представляет перевод карточных каталогов в электронные (конверсия каталогов), и в связи с этим - концепции объединения традиционных и электронных каталогов в единую информационно-поисковую систему с единым лингвистическим обеспечением. Эти проблемы освещены в работах С. К. Вилснской, Н. А. Еалюк, М. Н.Захаровой, М. Н.Романовой, Е. М. Ручимской, О. А. Фуралева, И. Ю. Черкасовой и др.

  Проблемы лингвистического обеспечения постоянно обсуждаются на страницах библиотечной печати, ею занимаются видные теоретики библиотековедения и информатики, но эти разработки чаще носят теоретический характер и могут служить базой для дальнейших разработок прикладного характера. Практически отсутствуют работы о структуре лингвистического обеспечения НСХБ. Однако необходимость в этом назрела поскольку актуальной стала задача создания единой сетевой ИПС по вопросам АПК с единым или совместимым лингвистическим обеспечением. В этой ситуации с новых позиций следует рассматривать традиционные ИПЯ, которые используются в НСХБ и могут быть использованы в автоматизированной библиотечной ИПС. Поэтому необходимо глубокое и всестороннее исследование лингвистических средств НСХБ с целью разработки структуры ее лингвистического обеспечения, выработки рекомендаций по его совершенствованию. Недостаточная разработанность проблемы применительно к сельскохозяйственной ИПС явилась еще одним основанием для выбора темы исследования.

  Практическая значимость данного исследования – это усовершенствование модели лингвистического обеспечения в Белорусской сельскохозяйственной библиотеке, а также разработка путей внедрения средств лингвистического обеспечения в процессы поиска документов. 

Дипломная работа выполнена на базе Белорусской  сельскохозяйственной библиотеки им. И. С. Лупиновича Национальной академии наук Беларуси. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

      Глава 1. Теоретические аспекты лингвистического обеспечения автоматизированных библиотечно-информационных систем. 

      1.1. Понятие, состав и требования к современному лингвистическому обеспечению.

 Создать условия, при которых читатель может получить доступ к информационно-поисковым системам библиотек различной удаленности и вести эффективный поиск в них, помогают лингвистическое обеспечение (ЛО) и его основная составляющая - информационно-поисковые языки (ИПС). Задача библиотек состоит не только в том, чтобы собрать в своих фондах возможно полно документы, но сделать их доступными для пользователя, дать информацию о них и раскрыть информацию, содержащуюся в них. Всему этому способствуют каталоги, базы данных, библиографические и реферативные издания. Информация в них должна быть систематизирована и представлена в таком виде, который позволяет осуществлять быстрый поиск в данных ИПС, БД, электронном каталоге.

Любая ИПК включает следующие элементы:

  1. информационный массив;
  2. ИПЯ, на которой переводится входная информация и запросы; правила этого перевода (индексирование);
  3. критерии выдачи, то есть правила сравнения перевода запроса на ИПЯ с результатами перевода на ИПЯ входной информации, определяющие отбор информации, подлежащей выдаче на запрос.
 

 Понятие ЛО шире понятия информационно-поискового языка, поскольку включает их в себя. Лингвистическое обеспечение автоматизированных систем включает ИПЯ, методики индексирования документов и запросов на них, инструкции и методики их ведения и использования, а также средства поддержания ИПЯ в автоматизированной системе.

 Средством свертывания информации и смысловой обработки документов является информационно-поисковый язык (ИПЯ) - формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов. Искусственный язык, специально разработанный для автоматизированного поиска, лишен недостатков естественного языка (многозначность, избыточность) и лучше приспособлен для информационного иска, увеличивая полноту и точность выдачи информации. При создании ИПЯ учитываются требования, которые отвечают его задаче - полноте и точности поиска:

  • однозначность - каждая запись на ИПЯ должна иметь только один смысл, то есть искусственный ИПЯ должен устранять такие недостатки, с точки зрения поиска естественного языка, как полисемия и омонимия;
  • явное выражение полезных для поиска семантических (смысловых) отношений между словами (логических отношений и психологических ассоциаций) ИПЯ;
  • возможность корректировки и дополнения ИПЯ;

удобство пользования, ИПЯ должен обладать компактностью записей, способствующих его запоминанию;

- способность точно идентифицировать предмет, отличить его особенности и описать его с необходимой степенью детализации и глубины.

 Семантическое богатство ИПЯ зависит от его терминологической наполненности, структуры построения и от взаимоотношений лексических единиц, составляющих лексику, словарный состав ИПЯ, Лексическая единица (ЛЕ) информационно-поискового языка - это обозначение отдельного понятия, принятое в нем. Лексические единицы каждого ИПЯ называются по-разному: в классифицированных системах - это индексы, в языке предметных рубрик это - рубрики, в дескрипторных языках - дескрипторы, в языке

ключевых слов - ключевое слово. По тому, какие лексические единицы используются в ИПЯ, различают словарные и кодированные ИПЯ. В словарных ИПЯ (тезаурус) используются элементы естественного языка, и перевод на естественный язык не требуется. В кодированных ИПЯ (УДК, ББК) индексы или рубрики сопровождаются таблицей соответствия, то есть каждой лексической единице на искусственном языке дается словесное ее выражение на естественном языке. Основу лексики любого ИПЯ составляют термины, являющиеся носителями научной информации в текстах документов. Любой ИПЯ создается на основе терминологии определенной области знаний.

 Разработка ИПЯ проходит несколько этапов: отбор лексических единиц; процесс нормализации лексики; систематизация и группировка лексики; построение классификационных схем; оформление лексики ИПЯ.

 Этап отбора лексических единиц особенно важен в процессе создания информационно-поискового языка, поскольку от него зависят возможности данного ИПЯ: терминологическая наполненность, соответствие уровню развития науки, отражаемой в нем, а значит, и поисковые возможности данного ИПЯ. Отбор лексических единиц происходит в процессе аналитико-синтетической обработки документов на этапе аннотирования, систематизации индексирования.

 ИПЯ неразрывно связан с процессом аналитико-синтетической обработки информации, поскольку на этом этапе раскрывается тематическое содержание документа, происходят свертывание информации, представленной в нем, и ее перевод на формализованный язык, позволяющий внести информацию в ЭК, а затем вести в нем поиск. Прежде чем информация предстанет в виде элементов ИПЯ, она проходит семантическую, то есть смысловую обработку. Текст, представленный на естественном языке, анализируется с точки зрения его содержания. В ходе осмысления содержания текста документа человеком (семантической обработки) происходит отбор наиболее значимых, основных тем документа, а затем их перевод с естественного на искусственный язык. При этом точность и полнота перевода зависят от возможностей ИПЯ, От уровня разработки его лексического и терминологического аппарата, наличия правил этого перевода.

 Таким образом, именно ИПЯ является основным компонентом любой ИПС, без которой она превращается только в беспорядочный «сундук» информации. В традиционной ИПС использовались ИПЯ, разработанные для карточных каталогов; наибольшее распространение получили Универсальная десятичная классификация (УДК) и Библиотечно-библиографическая классификация (ББК). Однако использование их в автоматизированных системах пока не обеспечивает эффективного поиска. Вместе с тем существуют ИПЯ, специально разработанные для автоматизированных ИПС и для автоматизированного поиска: рубрикаторы, тезаурусы. При создании электронных каталогов, автоматизированных ИПС перед библиотеками встает задача выбора ЛО и ИПЯ, которые будут использоваться в них.

 Как правило, в одной информационно-поисковой системе используются несколько ИПЯ, поэтому встает вопрос об их совместимости. В условиях одной ИПС эта проблема решается, если все документы, входящие в ее документный поток, индексируются на всех ИПЯ, используемых в данной поисковой системе. Для достижения совместимости в одной ИПС следует обеспечить единую методику индексирования на всех ИПЯ этой системы, а также добиться унификации и стандартизации языковых средств и поддерживающих компонентов ЛО.

 Использование нескольких ИПЯ в одной ИПС объясняется тем, что каждый из языков предназначен для выполнения определенных функций в ней, а также осознанием того, что не может быть создан единый ИПЯ, выполняющий одновременно все функции лингвистических средств и все задачи, стоящие перед информационно-поисковой системой. Одновременное использование нескольких информационно-поисковых языков обеспечивает быстрый и разнообразный доступ потребителя к информационным ресурсам

Информация о работе Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля