Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля

Автор работы: Пользователь скрыл имя, 06 Сентября 2011 в 11:27, дипломная работа

Описание работы

Целью исследования является обоснование структуры лингвистического обеспечения научных сельскохозяйственных библиотек, способствующей максимально полному удовлетворению информационных потребностей ученых и практиков в релевантной информации по вопросам АПК.

Содержание работы

Введение - 3 -
Глава 1. Теоретические аспекты лингвистического обеспечения автоматизированных библиотечно-информационных систем. - 9 -
1.1. Понятие, состав и требования к современному лингвистическому обеспечению - 9 -
1. 2. Обзор лингвистического обеспечения сельскохозяйственных библиотек России и Украины - 17 -
1.2.2. Средства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук - 22 -
Глава 2. Структура лингвистических средств Белорусской сельскохозяйственной библиотеки им. И. С. Лупиновича Национальной академии наук Беларуси - 28 -
2.1. База данных УДК и ее применение в качестве информационно-поискового языка - 30 -
2.2. Тезаурус по сельскому хозяйству и продовольствию - 39 -
2.2.1. Назначение и структура тезауруса - 39 -
2.2.2. Парадигматические отношения - 45 -
2.2.3. Использование тезаурусов - 54 -
2.3. Проблема выбора средств лингвистического обеспечения и их интеграции в библиотеках АПК. - 58 -
Заключение - 62 -
Приложение №1…………………………………………

Файлы: 1 файл

DIPLOM.doc

— 855.00 Кб (Скачать файл)
 
 
  1. Маршак, Б. И. Как из птицы ИБИС получить дикую кошку ИРБИС, а затем ее приручить [Текст] / Б. И. Маршак, А. И. Бродовский // Электронные изображения и визуальные искусства (ЕУА' 2000, Москва): материалы конференции. - М., 2000. -С.153-157.
  2. Пименов, Е. О тезаурусе замолвим слово [Текст] / Е. Пименов // Библиотека. -2001. - № 7. - С. 42-45.
  3. Шрайберг, Я. Л. Электронные библиотеки России: программная стратегия и проектная тактика [Текст] / Я. Л. Шрайберг // Научные и технические библиотеки. -2001. -№ 2. -С. 69-74
  4. Скарук, Е. А. Лингвистическое обеспечение тематического поиска в электронном каталоге [Текст] / Е. А. Скарук // Библиография. - 2001. - № 2. - С. 75-77.
  5. Казаков, Е. Н. Способы описания информационных потребностей пользователей при взаимодействии с электронными библиотеками через посредник с тезаурусом и рубрикатором [Текст] / Е. Н. Казаков // Сборник трудов Третьей всероссийской конференции по электронным библиотекам "Электронные библиотеки: перспективные методы и технологии, электронные коллекции". - Петрозаводск, 2001. - С. 68-72.
  6. САВ Thesaurus.- 1995 ed. / CAB International. – 1315 c.
  7. AGROVOC. Multilinqual agricultultural thesaurus / FAO. Third ed. English version. – Rome, 1997. – 602 c.
  8. Пирумова, Л. Н. Тезаурус по сельскому хозяйству и продовольствию: индексирование документов и поиск информации в БД АGRОS [Текст]: методические материалы / Л. Н. Пирумова, Л. Т. Харченко; ЦНСХБ Россельхозакадемии. - М., 2001. - 69 с.
  9. Сукиасян, Э. Р. Библиотечные каталоги: методические материалы [Текст] / Э. Р. Сукиасян. - М.: ИПО Профиздат, 2001. - 187 с. -  ISBN 5-88283-047-8. -(Современная библиотека, Вып. 19).
  10. Пирумова, Л. Н. О совершенствовании структуры лингвистических средств ЦНСХБ Россельхозакадемии [Текст] / Л. Н. Пирумова, В. Е. Поздняков // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества. - М., 2000. - Т. 1.
 
  1. Алешин, Л. И. Поиск документов [Текст]: анализ и новые возможности / Л. И. Алешин // Библиография. - 2002. - № 4. - С. 14-22.
  2. ЕnVoc. Многоязычный тезаурус терминов по окружающей среде [Текст]: информационный продукт системы ИНФОТЕРРА - Глобальные сети ЮНЕП по обмену информации по окружающей среде. - 4. изд.. - М. : ИНФОТЕРРА, 1999.
  3. Ханжин, А. Г. Теоретические проблемы развития автоматического индексирования и поиска документов [Текст] / А. Г. Ханжин // Информационное общество. Интеллектуальная обработка информации. Информационные технологии. - М., 2002. - С. 365-367.
  4. Пирумова, Л. Н. Лингвистическое обеспечение баз данных по сельскому хозяйству: проблемы кооперации [Текст] / Л.Н. Пирумова // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: материалы конференции, Судак, Украина, 51-13 июня 1999 г. / ГПНТБ России. - Судак, 1999. - Т. 2. - С. 90-92.
  5. Пирумова, Л. Н. Лингвистическое обеспечение производства текущих изданий ЦНСХБ Россельхозакадемии [Текст] / Л. Н. Пирумова // Библиотечное Дело-2000. Проблемы формирования открытого информационного общества: тезисы докладов 5-ой международной научной конференции (Москва, 25-26 апреля, 2000 г.). - М., 2000.-С. 170-171.
  6. Пирумова, Л. Н. Новый этап в информационном обслуживании потребителей ЦНСХБ [Текст] / Л.Н. Пирумова // Аграрная наука. - 1998. - № 3. -С. 28-29.
  7. Пирумова, Л. Н. Об информативности пристатейных резюме в отечественных изданиях по вопросам АПК [Текст] / Л.Н. Пирумова // Библиотечное Дело-2001. Российские Библиотеки в мировом информационно и интеллектуальном пространстве: тезисы докладов 6-й международной научной конференции (Москва, 26-27 апреля, 2001 г.).- М., 2001. - С. 176-178.
  8. Пирумова, Л. Н. Проблемы адаптации читателей к новым формам информационных услуг [Текст] / Л. Н. Пирумова // Тезисы докладов международной научной конференции «Информационное общество: культурологические аспекты и проблемы», Краснодар, 9 сентября, 1997 г. - Краснодар, 1997. - С. 293-295.
  9. Пирумова, Л. Н. Совершенствование лингвистического обеспечения БД ЦНСХБ «АГРОС» [Текст] / Л.Н. Пирумова // Тезисы докладов и сообщения научной конференции «Библиотечное дело и демократия», 8-10 апреля, 1997 г. - М., 1997. -С. 62-65.
  10. Пирумова, Л. Н. Аналитическая деятельность ЦНСХБ [Текст] / Л.Н. Пирумова, О. Б. Сладкова // Информационные ресурсы России. - 1998. - № 1. - С. 34-37.
  11. Пирумова, Л. Н. Проблемы лингвистического обеспечения в БД «АГРОС» документального потока по пищевой промышленности [Текст] / Л. Н. Пирумова // Библиотечное дело и проблемы информатизации общества: тезисы докладов международной научной конференции, Москва, 27-28 апреля, 1999 г. / МГУК. - М., 1999.-Ч. 1.-С. 175-177.
  12. Пирумова, Л. Н. Роль и место ЦНСХБ в формировании современной отраслевой информационной среды [Текст] / Л. Н. Пирумова // НТИ. Сер. 1. - 1995. - №2. - С. 36-38.
  13. Пирумова, Л. Н. О совершенствовании структуры лингвистических средств ЦНСХБ Россельхозакадемии [Текст] / Л. Н. Пирумова, В. Г. Поздняков // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: труды конференции Судак, Украина, 9-17 июня 2001 г. / ГПНТБ России. - Судак, 2001. - Т. 1.-С. 528-531.
  14. Пирумова, Л. Н. Индексирование документов базы данных ЦНСХБ [Текст] / Л. Н. Пирумова, Л. Т. Харченко. - М., 1995. - 35 с.
  15. Master Reference File (MRF) [Электронный ресурс] / UDC Consortium // http://www.udcc.org/mrf.htm
  16. Strachan, P.D. The UDC MRF Database Development and Design – a historical review [Электронный ресурс] / P.D. Strachan, M. H. Oomes; UDC Consortium // http://www.udcc.org/mrf2.htm
  17. UDC-Online [Электронный ресурс] / UDC Consortium // http://www.udconline.net/
  18. Яшина Н. Г. Гипертекстовое лингвистическое обеспечение электронной библиотеки: автореферат диссертации на соискание ученой степени кандидата педагогических наук: 05.25.03. – Казань, 2004. – 24 с.
 
  1. Закон України  «Про Національну програму інформатизації» .- К., 1998. -  10 с. 
 
  1.  Лавренова, О. А. Лингвистика информационных систем и межбиблиотечное сотрудничество / О. А. Лавренева // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества. – 1997 – Т. 2.- С. 12-18.
 
 
  1.   Митчелл, Д. Десятичная классификация Дьюи: средство организации знаний для XXI века / Д. Митчел // Научные и технические библиотеки , 1999.- № 4, C. 35-36.
  2. Про порядок формування предметних рубрик электронного каталогу ДНСГБ УААН: інструкція /Л. М. Татарчук // Бюлетень ДНСГБ УААН.- Вип.1.- 2009.- С. 32-36.
 
  1.  Державний  стандарт України ДСТУ 25395-2000 (ISO 5963:1985) Інформація та документація. Обстеження документа, встановлення його предмета та відбір термінів індексування. Загальна методика. - К., 2001.
  2. Універсальна десяткова  класифікація (УДК): у 2 - х кн. / Книжкова палата України, - К., 2000. - 929 с.
 
  1.  Бардієр  К. Структура лінгвістичного забезпечення  сучасних інформаційних сервісів / К. Бардієр // Бібліотечний вісник . - 2002 .- № 1, - С. 55 – 61.
  2. Вергунов, В. А. Державна наукова сільськогосподарська бібліотека УААН: історія і сьогодення / В. А. Вергунов; УААН. ДНСГБ. – К., 2007 [2008]. – 480 с. – (Іст.-бібліогр. сер. «Аграр. наука України в особах, документах, бібліографії; Кн. 20).
  3. Малицкий, Н. А. Функциональные возможности современных библиографических ИПС на Web [Электронный ресурс] / Н. А. Малицкий, Б. С. Елепов // http://www.nbuv.gov.ua/Articles/crimea/2004/doc/258.pdf
  4. http://www.dnsgb.kiev.ua/
  5. http://irbis.gpntb.ru/
 
 
 
 

Приложение № 1

    Основные понятия применяющиеся в среде лингвистического обеспечения АБИС СЛОВАРЬ

  1. Упорядоченный перечень слов, словосочетаний, терминов, символических имен или наименований, знаков с указанием их значений или толкований или без них. Важным требованием к словарям, используемым в автоматизированных системах, является устранение синонимии и омонимии для обеспечения точности и полноты поиска.
  2. В автоматизированных информационных системах - это структура данных, обеспечивающая доступ к БД и отдельным записям по их текстовому имени.
 

    Виды словарей

    Машинный словарь - словарь, находящийся в памяти ЭВМ и использующийся для автоматического и/или контролируемого индексирования. 

    Рубрикатор - разновидность словаря, содержанием которого является перечень предметных рубрик и их классификационных индексов. Одним из наиболее распространенных видов рубоикаторов являются иерархические тематические рубрикаторы (УДК, ГРНТИ, ББК, МКИ и др.). 

    Тезаурус (информационно-поисковый) - словарь, содержащий разрешенные для использования при индексировании лексические единицы ИПЯ, а также парадигматические отношения между этими лексическими единицами. Тезаурусы различают по принципу их организации (например, алфавитный, иерархический, фасетный), способу использования (например, машинный тезаурус, т.е. находящийся в памяти ЭВМ), тематике и полноте охвата его лексикой определенной предметной области (например, базовый тезаурус, рабочий тезаурус, многоотраслевой тезаурус, узкотематический тезаурус и т.п.) В некоторых автоматизированных информационых системах словари, выполняющие функции тезауруса, носят иные названия, например Базовый терминологический словарь (БТС) ВИМИ. 

    Предметная рубрика - краткое наименование классификационного признака однородных объектов (узко) библиографической или (широко) информационной деятельности. 

    Классификационный индекс - условное обозначение цифровыми или буквенно-цифровыми символами деления какой-либо системы классификации. 

    Синонимия - совпадение или близость значений различных слов (синонимов). 

    Омономия - внешнее совпадение слов, одинаковых по написанию и звучанию (омонимов). 

    Лексическая единица - обозначение отдельного понятия в естественном или специально созданном искусственном языке, например ИПЯ. Лексическая единица может иметь вид слова, устойчивого словосочетания, аббревиатуры, символьного кода и т.п. 
 

Виды отношений и связанные с ними термины Ассоциативные отношения

  1. Разновидность парадигматических отношений, отражающих представление пользователя о взаимосвязи понятий, которые они отображают. Часто под ассоциативными отношениями понимаются все виды парадигматических отношений, кроме отношений типа "вид-род" и "часть-целое". Так же как и парадигматические отношения, они являются внетекстовыми и служат для реализации конкретных задач пользователей.
  2. Отношения между данными в структурах данных.

    Парадигматические отношения, аналитические отношения, ассоциативные отношения - вид логических отношений между лексическими единицами ИПЯ (дескрипторами, ключевыми словами и т.п.), не зависящими от конкретного контекста, в котором соответствующие им понятия употребляются. Парадигматические отношения позволяют осуществлять избыточное индексирование текстов путем включения в поисковый образ документа и поисковое предписание близких по смыслу лексических единиц ИПЯ для повышения полноты поиска.

    Семантические отношения - отношения между понятиями в "семантических сетях". Различают лингвистические (соответствующие и взаимоотношению слов в предложении), теоретико-множественные и логические отношения.

    Синтагматические отношения, текстуальные отношения, синтаксические отношения - отношения между лексическими единицами ИПЯ (дескрипторами, ключевыми словами и т.п.), которые выражают логические связи между соответствующими понятиями в тексте документа. Синтагматические отношения являются разновидностью семантических отношений. 

    Синтагма - группа лексических единиц, связанных синтагматическими отношениями и представляющих собой законченное предложение на информационно-поисковом языке. 

    Фасет - группа однородных терминов, связанных общностью какого-либо признака (характеристики, основания деления). Служит средством построения ИПЯ фасетной структуры. 

    Индексирование - это процесс перевода содержания документов и запросов с естественного на информационно-поисковый язык, в результате чего создаются поисковые образы документов (ПОД) и поисковые предписания (ПП).

    Индексирование, наряду с составлением библиографического описания, реферированием, аннотированием , составлением обзоров, является разновидностью аналитико-синтетической обработки или свертывания информации.

    В зависимости от ИПЯ (иерархическая классификация, алфавитно-предметная классификация, дескрипторный ИПЯ) индексирование может воплощаться в следующих процессах:

    -предметизация, т.е. индексирование на основе языка предметных рубрик, алфавитно-предметной классификации

    -систематизация литературы, осуществляемая на базе классификационных иерархических ИПЯ

    -координатное индексирование, реализуемое на основе дескрипторного ИПЯ или языка ключевых слов.

    Соответственно, в зависимости от используемого ИПЯ, результатом индексирования т.е. ПОД и ПП, могут быть либо индекс классификации, либо перечень дескрипторов или

ключевых слов. 

    Информационно-поисковый язык (ИПЯ) - это искусственный язык, предназначенный для выражения содержания документов или запросов или описания фактов с целью последующего поиска. 

    Дескрипторный ИПЯ - это ИПЯ, лексическими единицами которого являются дескрипторы и использование которого основано на принципе координатного индексирования. 

    Координатное индексирование - это индексирование путем перечисления ключевых слов и/или дескрипторов.

    Принцип координатного индексирования заключается в том, что центральная тема документа или информационного запроса выражается в виде перечня наиболее значимых слов или словосочетаний, которые являются как бы координатами документа или запроса.

    В состав лексики отбирают не любые слова вообще, а "ключевые слова", т.е. слова, несущие в тексте наибольшую смысловую нагрузку. 

     Ключевое слово - это полнозначное слово или словосочетание, являющееся носителем существенной в данном тексте (документе или запросе) информации с точки зрения информационного поиска. 

    Нормативный словарь, в котором в едином алфавитном ряду приведены все важнейшие ключевые слова и дескрипторы отрасли или области знаний с соответствующими пометами, называется дескрипторным словарем. 

    Нормативный словарь дескрипторов и ключевых слов с зафиксированными парадигматическими отношениями, предназначенный для координатного индексирования документов и запросов, называется информационно-поисковым тезаурусом. Слово "тезаурус" происходит от греческого слова 'ЧЬезаип" - сокровище. Лексика дескрипторного ИПЯ в качестве основных лексических единиц включает дескрипторы и аскрипторы. 

    Дескриптор - это нормализованное слово, или словосочетание, выбранное из группы синонимичных или близких по значению, ключевых слов (класса условной эквивалентности) и предназначенное для индексирования документов и запросов, др. словами - нормализованное слово, которому искусственным путем придана смысловая однозначность. 

Информация о работе Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля