Информационно поисковые системы

Автор работы: Пользователь скрыл имя, 11 Января 2017 в 14:40, реферат

Описание работы

В ХХ в. слово информацияи его производные стали необычайно популярными и, как следствие, почти бессодержательными. Существует бесчисленное множество определений и подходов к этому понятию. Информация – это, видимо, свойство живой природы. Само слово информацияпо своей внутренней форме (лат. informatio – осведомление, сообщение) предполагает общение, коммуникацию. Информацией обмениваются любые живые формы материи: растения, насекомые, животные, люди. В человеческом обществе информация может быть получена самыми разными способами: путем фиксации результатов наблюдений или измерений, в результате экспериментов, на основе умозрительного логического вывода и т.д

Содержание работы

Понятие об информации...........................................................................2
Основные понятия информационного поиска........................................5
Понятие об информационно-поисковой системе...................................7
Типы информационно-поисковых систем..............................................12
Состав информационно-поисковой системы.........................................16
История развития информационно-поисковых систем.........................19
Информационно-поисковые языки.........................................................25
Консультант Плюс....................................................................................33
Список используемой литературы..........................................................38

Файлы: 1 файл

реферат информатика.docx

— 61.57 Кб (Скачать файл)

Принципы создания ИПТ и их форма определяются специальными государственными стандартами. В обычном случае ИПТ состоит из двух основных частей – собственно тезауруса, в котором представлены все дескрипторы с указанием связей между ними, и комплекса указателей, позволяющих перейти от дескриптора к структуре тезауруса. Кроме алфавитного указателя дескрипторов, ИПТ может включать частотные указатели, указатели допустимых сочетаний дескрипторов и пр. Как правило, словарная статья ИПТ включает сам дескриптор и четыре зоны:

  • синонимы к данному дескриптору;
  • "вышестоящие" дескрипторы (более общие термины по сравнению с данным; отношение "гипероним → гипоним");
  • "нижестоящие дескрипторы" (более частные термины по сравнению с данным; отношение "гипоним → гипероним");
  • ассоциативные дескрипторы.

Синонимия является неиерархическим симметричным отношением, которое нежелательно для ИПТ, поскольку синонимия осложняет процесс информационного поиска. Часто отраслевые тезаурусы содержат синонимы, однако статус дескрипторов (элементов ИПЯ) получает только один из лексических элементов синонимического ряда. Иногда в ИПТ вводятся и другие типы симметричных отношений – отношения сходства, общего подчинения по различным признакам.

Правила использования тезауруса – приписывания дескрипторов документам – регламентируются специальными инструкциями, различающимися от одной ИПС к другой. Тем не менее, инструкции не спасают: практика показывает, что процесс ручного индексирования представляет собой сложную задачу, в которой соединяются абсолютно рутинные процедуры и искусство. Качество индексирования документов в огромной степени определяет эффективность информационного поиска. Для улучшения характеристик полноты поиска часто используют метод избыточного индексирования: поисковый образ документа и поисковое предписание пополняются за счет ассоциативных дескрипторов. Разумеется, это ухудшает параметры поиска на точность.

Решение о релевантности документа данному запросу определяется специальными критериями выдачи(KB). Здесь различаются два основных типа критериев – вычисляемые и логические.

Вычисляемые KBопираются на количественные характеристики. Обычно это соотношение количества одинаковых дескрипторов в ПОДе и поисковом предписании. Полное совпадение дескрипторов ПОДа и поискового предписания как основной KB используется крайне редко. Как правило, речь идет о пересечении, количественная оценка которого производится в процентах. Чаще всего в качестве порога релевантности используется величина в 50 %. Значение критерия выдачи  вычисляется по следующей формуле:

,

где  – количество совпавших дескрипторов в ПОДе и поисковом предписании;  – общее количество дескрипторов в поисковом предписании.

В некоторых случаях для повышения точности поиска различным дескрипторам приписываются веса, отражающие их значимость для описания содержания документа или для выражения информационной потребности пользователя. В этом случае в KB весадескрипторов, естественно, так или иначе, учитываются.

Логические критерии выдачи основываются на тех логических отношениях, которые устанавливаются пользователем между дескрипторами поискового предписания. Последнее имеет вид конъюнктивной нормальной формы – конъюнкции дизъюнкций. Конъюнкциейсвязываются дескрипторы, отражающие различные аспекты запроса, а оператор дизъюнкциииспользуется для связывания дескрипторов, находящихся в отношении квазисинонимии.

Увеличение объема документов в современных ИПС приводит к тому, что ручное индексирование документов становится практически невозможным. Стратегически эта проблема решается в настоящее время по двум основным направлениям.

Первое направление – создание систем автоматического индексирования. Функционально они заменяют ручное индексирование и позволяют создавать ПОДы документов в автоматическом режиме. Хорошие системы автоматического индексирования не уступают по качеству работы ручному индексированию. Алгоритмы работы систем такого рода включают два основных этапа. На первом этапе происходит отбор лексических единиц из текста на основании списка ключевых слов, существенных для данной проблемной области, а на втором – отобранные слова с помощью процедур морфологического анализа приводятся к каноническому/исходному виду. В качестве такового может фигурировать не только исходная словарная форма, но и псевдооснова.

Вторая стратегия решения проблемы ручного индексирования связана с разработкой ИПС бестезаурусного типа. Такие ИПС работают с пользователем на ограниченном естественном языке, а поиск осуществляется по текстам рефератов документов, по их библиографическим описаниям, а часто и по самим документам. Для индексирования в ИПС бестезаурусного типа используются слова и словосочетания естественного языка. Работа с естественным языком предполагает, что в ИПС должны быть встроены грамматические парсеры. Проводившиеся эксперименты показали, что ИПС последнего типа, несколько снижая параметры поиска по полноте, существенно повышают точность выдачи. Именно в этом направлении идет развитие современных ИПС.

 

 

8.КонсультантПлюс — компьютерная справочно-правовая система в России, разрабатывается компанией «КонсультантПлюс» и содержит свыше 87 миллионов документов по состоянию на март 2016 г.

Широко используется юристами, бухгалтерами, кадровыми специалистами, руководителями организаций, специалистами госорганов, учеными, студентами и преподавателями юридических и экономических вузов.

Распространяется через сеть региональных информационных центров (РИЦ), состоящую из 300 центров, расположенных в крупных городах, и более 400 сервисных подразделений в небольших населенных пунктах.

Наряду с системами «Гарант» и «Кодекс», КонсультантПлюс входит в «большую тройку» справочно-правовых систем России (2010 г.)

Информация, включённая в систему, структурирована по разделам[3]; в настоящее время в СПС КонсультантПлюс представлены следующие разделы:

  • законодательство;

  • судебная практика;

  • финансовые и кадровые консультации;

  • консультации для бюджетных организаций;

  • комментарии законодательства;

  • формы документов;

  • проекты нормативных правовых актов;

  • международные правовые акты;

  • правовые акты по здравоохранению;

  • технические нормы и правила.

Каждый раздел делится на информационные банки. Кроме того, отдельно представлены справочная информация для специалистов, новости и обзоры законодательства, онлайн-сервисы (доступ к архивам судебных решений, сервисы «Конструктор договоров» и «Конструктор учетной политики»).

Деление массива информации на информационные банки преследует ещё одну цель — реализовать модульный принцип построения технических систем. Специалисты могут подобрать комплекты системы в зависимости от того, какая информация им необходима для работы. Существуют специализированные системы КонсультантПлюс для бухгалтера, кадровика, юриста, работников бюджетных, строительных, медицинских организаций, для малого бизнеса.

Виды информации в системе


В СПС КонсультантПлюс включаются документы следующих видов:

  • нормативные правовые акты РФ, законодательство 85 субъектов, основные международные правовые акты и законодательство СССР, проекты законов и нормативных правовых актов;

  • комментарии законодательства;

  • финансовые, кадровые, юридические консультации;

  • Путеводители КонсультантПлюс — аналитические материалы, разработанные КонсультантПлюс, с пошаговыми инструкциями, анализом спорных ситуаций и судебной практики; примерами и образцами заполнения форм документов;

  • книги и статьи из периодической печати и сборников, около 120 изданий бухгалтерской и кадровой прессы и 80 изданий юридической направленности;

  • схемы корреспонденции счетов;

  • формы документов как официально утверждённые, так и примерные;

  • справочная информация (календарь бухгалтера, курсы валют, размер ключевой ставки и т. п.);

  • обзоры законодательства (новое в российском законодательстве, новости для юриста и бухгалтера, госзакупки, обзоры по актуальным темам).

Отдельно в КонсультантПлюс представлены сервисы для составления и проверки документов:

  • Конструктор договоров — для создания и проверки договоров (с возможностью выбора условий, с рекомендациями и предупреждениями о рисках сторон). Помогает составлять наиболее популярные договоры (поставки, подряда, возмездного оказания услуг, аренды нежилого помещения, трудовой и др.);

  • Конструктор учётной политики — для создания и проверки учётной политики организации (с возможностью выбора условий, с рекомендациями и предупреждениями, учитывается специфика организации).

Поиск информации в системе


В КонсультантПлюс реализованы все современные возможности для поиска и работы с правовой информацией. Основные инструменты поиска в системе — Быстрый поиск (работает по аналогии с поисковой строкой в интернет-поисковиках), Карточка поиска (возможен расширенный поиск по реквизитам), Правовой навигатор (поиск по ключевым словам).

Поиск в программе адаптирован под поиск именно правовой информации и учитывает профессиональную лексику (например, упрощенка) и распространенные сокращения (НДФЛ, ККТ). К основным поисковым инструментам и к наиболее востребованной информации доступ реализован прямо из Стартового окна системы.

Все документы из КонсультантПлюс можно сохранять, копировать, печатать, отправлять по электронной почте, делать закладки в текстах. Есть возможность «поставить документы на контроль», то есть занести их в определенную папку и при каждом обновлении система будет проверять их на изменения (утрата или вступление в силу, официальная публикация, внесение изменений и другое).

 

Некоммерческие версии системы КонсультантПлюс


На официальном сайте разработчик предоставляет возможность работы с некоммерческой интернет-версией — сокращенной версией коммерческих систем[4] (основные документы российского законодательства доступны круглосуточно, доступ к более широкому набору документов ограничен по времени суток).

С 2011 г. компания «КонсультантПлюс» развивает бесплатные мобильные приложения, которые также позволяют получить доступ к некоммерческим версиям системы:

1) «КонсультантПлюс: основные документы» 
Это круглосуточный оперативный доступ ко всем кодексам РФ, основным правовым актам федерального законодательства, а также обзорам новых документов и справочным материалам. По расписанию доступна расширенная база документов. Вся информация в приложении ежедневно обновляется, всегда доступны актуальные редакции документов.

Для работы без доступа в интернет можно заранее поставить закладки на любой документ или его часть. Документы с закладками сохраняются в разделе «Избранное». Приложение доступно для: iPhone/iPad, Android-устройств (смартфонов и планшетов), смартфонов на Windows Phone, планшетов на Windows.

2) Мобильное приложение  «КонсультантПлюс: Студент» 
Помимо правовой информации содержит современные учебники по праву, финансам, экономике и бухучету (более 170 книг).

Приложение доступно для: iPhone/iPad, Android-устройств.

Также КонсультантПлюс ежегодно выпускает ограниченные бесплатные версии своей системы для вузов, школ и т. д. (диски «Высшая школа» и «Средняя школа»[5]). По отдельным мнениям, поставляемая вместе с этими версиями документация зачастую неправомерно называется учебным пособием (например, «Введение в правовую информатику»), но при этом служит лишь для обучения пользователя работе с интерфейсами конкретной программы КонсультантПлюс

 

Информация о работе Информационно поисковые системы