Лингвистическое обеспечение автоматизированных систем библиотек сельскохозяйственного профиля
Дипломная работа, 06 Сентября 2011, автор: пользователь скрыл имя
Описание работы
Целью исследования является обоснование структуры лингвистического обеспечения научных сельскохозяйственных библиотек, способствующей максимально полному удовлетворению информационных потребностей ученых и практиков в релевантной информации по вопросам АПК.
Содержание работы
Введение - 3 -
Глава 1. Теоретические аспекты лингвистического обеспечения автоматизированных библиотечно-информационных систем. - 9 -
1.1. Понятие, состав и требования к современному лингвистическому обеспечению - 9 -
1. 2. Обзор лингвистического обеспечения сельскохозяйственных библиотек России и Украины - 17 -
1.2.2. Средства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук - 22 -
Глава 2. Структура лингвистических средств Белорусской сельскохозяйственной библиотеки им. И. С. Лупиновича Национальной академии наук Беларуси - 28 -
2.1. База данных УДК и ее применение в качестве информационно-поискового языка - 30 -
2.2. Тезаурус по сельскому хозяйству и продовольствию - 39 -
2.2.1. Назначение и структура тезауруса - 39 -
2.2.2. Парадигматические отношения - 45 -
2.2.3. Использование тезаурусов - 54 -
2.3. Проблема выбора средств лингвистического обеспечения и их интеграции в библиотеках АПК. - 58 -
Заключение - 62 -
Приложение №1…………………………………………
Файлы: 1 файл
DIPLOM.doc
— 855.00 Кб (Скачать файл)- Маршак, Б. И. Как из птицы ИБИС получить дикую кошку ИРБИС, а затем ее приручить [Текст] / Б. И. Маршак, А. И. Бродовский // Электронные изображения и визуальные искусства (ЕУА' 2000, Москва): материалы конференции. - М., 2000. -С.153-157.
- Пименов, Е. О тезаурусе замолвим слово [Текст] / Е. Пименов // Библиотека. -2001. - № 7. - С. 42-45.
- Шрайберг, Я. Л. Электронные библиотеки России: программная стратегия и проектная тактика [Текст] / Я. Л. Шрайберг // Научные и технические библиотеки. -2001. -№ 2. -С. 69-74
- Скарук, Е. А. Лингвистическое обеспечение тематического поиска в электронном каталоге [Текст] / Е. А. Скарук // Библиография. - 2001. - № 2. - С. 75-77.
- Казаков, Е. Н. Способы описания информационных потребностей пользователей при взаимодействии с электронными библиотеками через посредник с тезаурусом и рубрикатором [Текст] / Е. Н. Казаков // Сборник трудов Третьей всероссийской конференции по электронным библиотекам "Электронные библиотеки: перспективные методы и технологии, электронные коллекции". - Петрозаводск, 2001. - С. 68-72.
- САВ Thesaurus.- 1995 ed. / CAB International. – 1315 c.
- AGROVOC. Multilinqual agricultultural thesaurus / FAO. Third ed. English version. – Rome, 1997. – 602 c.
- Пирумова, Л. Н. Тезаурус по сельскому хозяйству и продовольствию: индексирование документов и поиск информации в БД АGRОS [Текст]: методические материалы / Л. Н. Пирумова, Л. Т. Харченко; ЦНСХБ Россельхозакадемии. - М., 2001. - 69 с.
- Сукиасян, Э. Р. Библиотечные каталоги: методические материалы [Текст] / Э. Р. Сукиасян. - М.: ИПО Профиздат, 2001. - 187 с. - ISBN 5-88283-047-8. -(Современная библиотека, Вып. 19).
- Пирумова, Л. Н. О совершенствовании структуры лингвистических средств ЦНСХБ Россельхозакадемии [Текст] / Л. Н. Пирумова, В. Е. Поздняков // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества. - М., 2000. - Т. 1.
- Алешин, Л. И. Поиск документов [Текст]: анализ и новые возможности / Л. И. Алешин // Библиография. - 2002. - № 4. - С. 14-22.
- ЕnVoc. Многоязычный тезаурус терминов по окружающей среде [Текст]: информационный продукт системы ИНФОТЕРРА - Глобальные сети ЮНЕП по обмену информации по окружающей среде. - 4. изд.. - М. : ИНФОТЕРРА, 1999.
- Ханжин, А. Г. Теоретические проблемы развития автоматического индексирования и поиска документов [Текст] / А. Г. Ханжин // Информационное общество. Интеллектуальная обработка информации. Информационные технологии. - М., 2002. - С. 365-367.
- Пирумова, Л. Н. Лингвистическое обеспечение баз данных по сельскому хозяйству: проблемы кооперации [Текст] / Л.Н. Пирумова // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: материалы конференции, Судак, Украина, 51-13 июня 1999 г. / ГПНТБ России. - Судак, 1999. - Т. 2. - С. 90-92.
- Пирумова, Л. Н. Лингвистическое обеспечение производства текущих изданий ЦНСХБ Россельхозакадемии [Текст] / Л. Н. Пирумова // Библиотечное Дело-2000. Проблемы формирования открытого информационного общества: тезисы докладов 5-ой международной научной конференции (Москва, 25-26 апреля, 2000 г.). - М., 2000.-С. 170-171.
- Пирумова, Л. Н. Новый этап в информационном обслуживании потребителей ЦНСХБ [Текст] / Л.Н. Пирумова // Аграрная наука. - 1998. - № 3. -С. 28-29.
- Пирумова, Л. Н. Об информативности пристатейных резюме в отечественных изданиях по вопросам АПК [Текст] / Л.Н. Пирумова // Библиотечное Дело-2001. Российские Библиотеки в мировом информационно и интеллектуальном пространстве: тезисы докладов 6-й международной научной конференции (Москва, 26-27 апреля, 2001 г.).- М., 2001. - С. 176-178.
- Пирумова, Л. Н. Проблемы адаптации читателей к новым формам информационных услуг [Текст] / Л. Н. Пирумова // Тезисы докладов международной научной конференции «Информационное общество: культурологические аспекты и проблемы», Краснодар, 9 сентября, 1997 г. - Краснодар, 1997. - С. 293-295.
- Пирумова, Л. Н. Совершенствование лингвистического обеспечения БД ЦНСХБ «АГРОС» [Текст] / Л.Н. Пирумова // Тезисы докладов и сообщения научной конференции «Библиотечное дело и демократия», 8-10 апреля, 1997 г. - М., 1997. -С. 62-65.
- Пирумова, Л. Н. Аналитическая деятельность ЦНСХБ [Текст] / Л.Н. Пирумова, О. Б. Сладкова // Информационные ресурсы России. - 1998. - № 1. - С. 34-37.
- Пирумова, Л. Н. Проблемы лингвистического обеспечения в БД «АГРОС» документального потока по пищевой промышленности [Текст] / Л. Н. Пирумова // Библиотечное дело и проблемы информатизации общества: тезисы докладов международной научной конференции, Москва, 27-28 апреля, 1999 г. / МГУК. - М., 1999.-Ч. 1.-С. 175-177.
- Пирумова, Л. Н. Роль и место ЦНСХБ в формировании современной отраслевой информационной среды [Текст] / Л. Н. Пирумова // НТИ. Сер. 1. - 1995. - №2. - С. 36-38.
- Пирумова, Л. Н. О совершенствовании структуры лингвистических средств ЦНСХБ Россельхозакадемии [Текст] / Л. Н. Пирумова, В. Г. Поздняков // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: труды конференции Судак, Украина, 9-17 июня 2001 г. / ГПНТБ России. - Судак, 2001. - Т. 1.-С. 528-531.
- Пирумова, Л. Н. Индексирование документов базы данных ЦНСХБ [Текст] / Л. Н. Пирумова, Л. Т. Харченко. - М., 1995. - 35 с.
- Master Reference File (MRF) [Электронный ресурс] / UDC Consortium // http://www.udcc.org/mrf.htm
- Strachan, P.D. The UDC MRF Database Development and Design – a historical review [Электронный ресурс] / P.D. Strachan, M. H. Oomes; UDC Consortium // http://www.udcc.org/mrf2.htm
- UDC-Online [Электронный ресурс] / UDC Consortium // http://www.udconline.net/
- Яшина Н. Г. Гипертекстовое лингвистическое обеспечение электронной библиотеки: автореферат диссертации на соискание ученой степени кандидата педагогических наук: 05.25.03. – Казань, 2004. – 24 с.
- Закон України «Про Національну програму інформатизації» .- К., 1998. - 10 с.
- Лавренова, О. А. Лингвистика информационных систем и межбиблиотечное сотрудничество / О. А. Лавренева // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества. – 1997 – Т. 2.- С. 12-18.
- Митчелл, Д. Десятичная классификация Дьюи: средство организации знаний для XXI века / Д. Митчел // Научные и технические библиотеки , 1999.- № 4, C. 35-36.
- Про порядок формування предметних рубрик электронного каталогу ДНСГБ УААН: інструкція /Л. М. Татарчук // Бюлетень ДНСГБ УААН.- Вип.1.- 2009.- С. 32-36.
- Державний стандарт України ДСТУ 25395-2000 (ISO 5963:1985) Інформація та документація. Обстеження документа, встановлення його предмета та відбір термінів індексування. Загальна методика. - К., 2001.
- Універсальна десяткова класифікація (УДК): у 2 - х кн. / Книжкова палата України, - К., 2000. - 929 с.
- Бардієр
К. Структура лінгвістичного
забезпечення сучасних інформаційних сервісів / К. Бардієр // Бібліотечний вісник . - 2002 .- № 1, - С. 55 – 61. - Вергунов, В. А. Державна наукова сільськогосподарська бібліотека УААН: історія і сьогодення / В. А. Вергунов; УААН. ДНСГБ. – К., 2007 [2008]. – 480 с. – (Іст.-бібліогр. сер. «Аграр. наука України в особах, документах, бібліографії; Кн. 20).
- Малицкий,
Н. А. Функциональные возможности
современных библиографических ИПС на
Web [Электронный ресурс]
/ Н. А. Малицкий, Б. С. Елепов // http://www.nbuv.gov.ua/
Articles/crimea/2004/doc/258. pdf - http://www.dnsgb.kiev.ua/
- http://irbis.gpntb.ru/
Приложение № 1
Основные понятия применяющиеся в среде лингвистического обеспечения АБИС СЛОВАРЬ
- Упорядоченный перечень слов, словосочетаний, терминов, символических имен или наименований, знаков с указанием их значений или толкований или без них. Важным требованием к словарям, используемым в автоматизированных системах, является устранение синонимии и омонимии для обеспечения точности и полноты поиска.
- В автоматизированных информационных системах - это структура данных, обеспечивающая доступ к БД и отдельным записям по их текстовому имени.
Виды словарей
Машинный
словарь - словарь,
находящийся в памяти ЭВМ и использующийся
для автоматического и/или контролируемого
индексирования.
Рубрикатор
- разновидность словаря, содержанием
которого является перечень предметных
рубрик и их классификационных индексов.
Одним из наиболее распространенных видов
рубоикаторов являются иерархические
тематические рубрикаторы (УДК, ГРНТИ,
ББК, МКИ и др.).
Тезаурус
(информационно-поисковый) - словарь,
содержащий разрешенные для использования
при индексировании лексические единицы
ИПЯ, а также парадигматические отношения
между этими лексическими единицами.
Тезаурусы различают по принципу их организации
(например, алфавитный, иерархический,
фасетный), способу использования (например,
машинный тезаурус,
т.е. находящийся в памяти ЭВМ), тематике
и полноте охвата его лексикой определенной
предметной области (например, базовый
тезаурус, рабочий тезаурус, многоотраслевой
тезаурус, узкотематический тезаурус
и т.п.) В некоторых автоматизированных
информационых системах
словари, выполняющие функции тезауруса,
носят иные названия, например Базовый
терминологический словарь (БТС) ВИМИ.
Предметная
рубрика - краткое наименование классификационного
признака однородных объектов (узко) библиографической
или (широко) информационной деятельности.
Классификационный
индекс - условное обозначение цифровыми
или буквенно-цифровыми символами деления
какой-либо системы классификации.
Синонимия
- совпадение или близость значений различных
слов (синонимов).
Омономия
- внешнее совпадение слов, одинаковых
по написанию и звучанию (омонимов).
Лексическая
единица - обозначение отдельного понятия
в естественном или специально созданном
искусственном языке, например ИПЯ.
Лексическая единица может иметь вид слова,
устойчивого словосочетания, аббревиатуры,
символьного кода и т.п.
Виды отношений и связанные с ними термины Ассоциативные отношения
- Разновидность парадигматических отношений, отражающих представление пользователя о взаимосвязи понятий, которые они отображают. Часто под ассоциативными отношениями понимаются все виды парадигматических отношений, кроме отношений типа "вид-род" и "часть-целое". Так же как и парадигматические отношения, они являются внетекстовыми и служат для реализации конкретных задач пользователей.
- Отношения между данными в структурах данных.
Парадигматические отношения, аналитические отношения, ассоциативные отношения - вид логических отношений между лексическими единицами ИПЯ (дескрипторами, ключевыми словами и т.п.), не зависящими от конкретного контекста, в котором соответствующие им понятия употребляются. Парадигматические отношения позволяют осуществлять избыточное индексирование текстов путем включения в поисковый образ документа и поисковое предписание близких по смыслу лексических единиц ИПЯ для повышения полноты поиска.
Семантические отношения - отношения между понятиями в "семантических сетях". Различают лингвистические (соответствующие и взаимоотношению слов в предложении), теоретико-множественные и логические отношения.
Синтагматические
отношения, текстуальные отношения, синтаксические
отношения - отношения между лексическими
единицами ИПЯ (дескрипторами, ключевыми
словами и т.п.), которые выражают логические
связи между соответствующими понятиями
в тексте документа. Синтагматические
отношения являются разновидностью
семантических отношений.
Синтагма
- группа лексических единиц,
связанных синтагматическими отношениями
и представляющих собой законченное предложение
на информационно-поисковом языке.
Фасет
- группа однородных терминов, связанных
общностью какого-либо признака (характеристики,
основания деления). Служит средством
построения ИПЯ фасетной структуры.
Индексирование - это процесс перевода содержания документов и запросов с естественного на информационно-поисковый язык, в результате чего создаются поисковые образы документов (ПОД) и поисковые предписания (ПП).
Индексирование, наряду с составлением библиографического описания, реферированием, аннотированием , составлением обзоров, является разновидностью аналитико-синтетической обработки или свертывания информации.
В зависимости от ИПЯ (иерархическая классификация, алфавитно-предметная классификация, дескрипторный ИПЯ) индексирование может воплощаться в следующих процессах:
-предметизация, т.е. индексирование на основе языка предметных рубрик, алфавитно-предметной классификации
-систематизация литературы, осуществляемая на базе классификационных иерархических ИПЯ
-координатное индексирование, реализуемое на основе дескрипторного ИПЯ или языка ключевых слов.
Соответственно, в зависимости от используемого ИПЯ, результатом индексирования т.е. ПОД и ПП, могут быть либо индекс классификации, либо перечень дескрипторов или
ключевых
слов.
Информационно-поисковый
язык (ИПЯ) - это искусственный язык,
предназначенный для выражения содержания
документов или запросов или описания
фактов с целью последующего поиска.
Дескрипторный
ИПЯ - это ИПЯ, лексическими единицами
которого являются дескрипторы и использование
которого основано на принципе координатного
индексирования.
Координатное индексирование - это индексирование путем перечисления ключевых слов и/или дескрипторов.
Принцип координатного индексирования заключается в том, что центральная тема документа или информационного запроса выражается в виде перечня наиболее значимых слов или словосочетаний, которые являются как бы координатами документа или запроса.
В
состав лексики отбирают не любые слова
вообще, а "ключевые слова", т.е. слова,
несущие в тексте наибольшую смысловую
нагрузку.
Ключевое
слово - это полнозначное слово или словосочетание,
являющееся носителем существенной в
данном тексте (документе или запросе)
информации с точки зрения информационного
поиска.
Нормативный
словарь, в котором в едином алфавитном
ряду приведены все важнейшие ключевые
слова и дескрипторы отрасли или области
знаний с соответствующими пометами, называется
дескрипторным словарем.
Нормативный
словарь дескрипторов и ключевых слов
с зафиксированными парадигматическими
отношениями, предназначенный для координатного
индексирования документов и запросов,
называется информационно-поисковым
тезаурусом. Слово "тезаурус" происходит
от греческого слова 'ЧЬезаип" - сокровище.
Лексика дескрипторного ИПЯ в качестве
основных лексических единиц включает
дескрипторы и аскрипторы.
Дескриптор
- это нормализованное слово, или словосочетание,
выбранное из группы синонимичных или
близких по значению, ключевых слов (класса
условной эквивалентности) и предназначенное
для индексирования документов и запросов,
др. словами - нормализованное слово, которому
искусственным путем придана смысловая
однозначность.