Информационно поисковые системы

Автор работы: Пользователь скрыл имя, 11 Января 2017 в 14:40, реферат

Описание работы

В ХХ в. слово информацияи его производные стали необычайно популярными и, как следствие, почти бессодержательными. Существует бесчисленное множество определений и подходов к этому понятию. Информация – это, видимо, свойство живой природы. Само слово информацияпо своей внутренней форме (лат. informatio – осведомление, сообщение) предполагает общение, коммуникацию. Информацией обмениваются любые живые формы материи: растения, насекомые, животные, люди. В человеческом обществе информация может быть получена самыми разными способами: путем фиксации результатов наблюдений или измерений, в результате экспериментов, на основе умозрительного логического вывода и т.д

Содержание работы

Понятие об информации...........................................................................2
Основные понятия информационного поиска........................................5
Понятие об информационно-поисковой системе...................................7
Типы информационно-поисковых систем..............................................12
Состав информационно-поисковой системы.........................................16
История развития информационно-поисковых систем.........................19
Информационно-поисковые языки.........................................................25
Консультант Плюс....................................................................................33
Список используемой литературы..........................................................38

Файлы: 1 файл

реферат информатика.docx

— 61.57 Кб (Скачать файл)

Содержание

  1. Понятие об информации...........................................................................2
  2. Основные понятия информационного поиска........................................5
  3. Понятие об информационно-поисковой системе...................................7
  4. Типы информационно-поисковых систем..............................................12
  5. Состав информационно-поисковой системы.........................................16
  6. История развития информационно-поисковых систем.........................19
  7. Информационно-поисковые языки.........................................................25
  8. Консультант Плюс....................................................................................33
  9. Список используемой литературы..........................................................38

 

 

 

 

 

 

 

 

 

 

 

 

 

1.Понятие об информации

В ХХ в. слово информацияи его производные стали необычайно популярными и, как следствие, почти бессодержательными. Существует бесчисленное множество определений и подходов к этому понятию. Информация – это, видимо, свойство живой природы. Само слово информацияпо своей внутренней форме (лат. informatio – осведомление, сообщение) предполагает общение, коммуникацию. Информацией обмениваются любые живые формы материи: растения, насекомые, животные, люди. В человеческом обществе информация может быть получена самыми разными способами: путем фиксации результатов наблюдений или измерений, в результате экспериментов, на основе умозрительного логического вывода и т.д. Различают информациюи данные(зарегистрированные сигналы). В этом случае говорят, что информация– это продукт обработки данных с помощью адекватных им методов. Информация, как всякий объект, обладает разнообразными свойствами. С точки зрения теории информационно-поисковых систем наиболее важными являются следующие свойства:

  • объективность,
  • достоверность,
  • адекватность,
  • полнота,
  • доступность и актуальность информации.

Информация может быть истинной или ложной, детерминированной или вероятностной. Существуют различные аспекты рассмотрения информации: прагматический, семантический, синтаксический.

Информация пронизывает все те сферы жизнедеятельности человека и общества, которые получили название социальных коммуникаций. В настоящее время сложился взгляд на информациюкак на особый ресурс, имеющий для человечества не меньшее значение, чем энергетические, сырьевые или финансовые ресурсы. Все возрастающее значение информационных ресурсов определяет интенсивное развитие новой науки, получившей название информатики. Можно определить ее как науку, систематизирующую методы создания, хранения, обработки и передачи данных средствами вычислительной техники, в также принципы функционирования этих средств. На пользовательском уровне достижения информатики проявляются в создании и использовании информационных систем.

Системы социальных коммуникаций по сути всегда являются системами информационного обмена. Эти системы состоят из функциональных и организационных компонент. Под первыми понимаются собственно информационные процессы, т.е. процессы создания, хранения, распространения и использования информационных сообщений. Ко вторым относятся создатели информации, потребители информации, информационные каналы и информационные системы.

Информационные процессы можно определить как совокупность последовательных действий, осуществляемых в системах социальных коммуникаций с целью доведения до потребителей информационных сообщений, а также функциональных и информационных связей, а информационные системы– как организационные компоненты информационного взаимодействия, оперирующие информацией и поддерживающие информационные процессы. Информационные потоки, представляющие собой совокупности данных, наполняют информационные процессы, связывая воедино всю систему информационного обмена.

Одни и те же люди или группы людей одновременно могут выступать как потребителии как создатели(поставщики) информации. В общем случае промежуточным потребителем и поставщиком информации может выступать и информационная система.

В 90-е годы ХХ в. широкое распространение получил термин информационные технологии. Фактически, это новое название для понятия система информационного обмена. Под информационными технологиями понимается совокупность процессов, методов и средств обработки информационных массивов. Как правило, это автоматизированные технологии с участием человека, или, как говорят, человеко-машинные системы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.Основные понятия информационного поиска

Понятия запроса и документа стоят в центре информационной деятельности. В процессе поиска информации происходит сравнение содержания запроса и документа. Степень соответствия документа запросу задается категорией релевантности. Каждый документ в ИПС получает определенный информационный код – кодируется с помощью информационно-поискового языка. Этот код называется поисковым образом документа(ПОД). Аналогичное выражение на информационно-поисковом языке –поисковое предписание(ПП) – сопоставляется запросу. Соответствие поискового образа документа поисковому предписания называется формальной релевантностью. Действительное соответствие содержания выданного документа содержанию запроса называется смысловой релевантностью. Очевидно, что классификация характеристик информационного поиска в значительной степени связана с возможными ошибками и сложностями, которые могут возникнуть в процессе информационной деятельности. Так, документ, релевантный запросу по смыслу, может оказаться не релевантным с формальной точки зрения и не будет выдан ИПС. С другой стороны, в процессе информационного поиска можно получить в выдаче значительный информационный шум– множество документов, формально релевантных, но не являющихся релевантными по смыслу. Возможен и другой случай, когда пользователь не может адекватно выразить свою информационную потребность: степень соответствия информационного запроса реальной информационной потребности называется пертинентностью. Для обеспечения пертинентности запросов разрабатываются специальные методики, включающие использование информационных словарей, которые позволяют пользователю более точно формулировать свою информационную потребность.

Результаты поиска могут характеризоваться с двух точек зрения: с точки зрения точности и с точки зрения полноты. Полнота поискаопределяется соотношением между количеством выданных релевантных (по отношению к данному запросу) документов к общему числу релевантных документов, имеющихся в информационной системе. Точность поисказадается отношением между количеством выданных релевантных документов к общему количеству документов в выдаче.

В идеальном случае количественное выражение полного и точного поиска равно единице.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3.Понятие о информационно-поисковой системе

Информационно-поисковая система(ИПС) – это упорядоченная совокупность документов (массивов документов) и информационных технологий, предназначенных для хранения и поиска информации – текстов (документов) или данных (фактов). Информационно-поисковыми системами являются любые определенным образом организованные хранилища информации. Причем информационно-поисковые системы могут быть и неавтоматизированными. Главное – это целевая функция: хранение и поиск информации. По типу хранимой и обрабатываемой информации, а также по особенностям поиска ИПС разделяются на две больших группы – документальные и фактографические.

В зависимости от объекта хранения и типа запроса различают два вида информационного поиска: документальный и фактографический – и, соответственно, два типа ИПС – документальные и фактографические. Последние также называют информационно-справочными ИПС.

Документальными(documentretrievalsystems, referencesearchingsystems, citationsearchingsystemsetc.) называются ИПС, в которых реализуется поиск по тематическим запросам в массиве документов или текстов с последующим предоставлением пользователю подмножества этих документов или их копий. Понятие документа может меняться от системы к системе. В общем случае это некий информационный объект, зафиксированный (обычно посредством некоторой знаковой системы) на каком-то материальном носителе (бумага, фото- и кинопленка, магнитная память и т.п.) и предназначенный для передачи информации в пространстве и времени в системе социальных коммуникаций.

Фактографические(question-answering systems, factual systems, object-oriented information systems etc.)ИПС реализуют хранение, поиск и выдачу непосредственно фактических данных(научных, технических, экономических характеристик и свойств объектов, процессов, явлений, адресов, наименований, количественных данных и т.п.).

Документальные и фактографические системы прежде всего различаются степенью предварительной интеллектуальной обработки материала. В документальных системах объекты хранения и выдачи – документы (тексты) целиком. При фактографическом поиске объекты хранения и выдачи – это представленные в специальной форме сведения (факты) об определенном объекте или классе объектов. Эти сведения или непосредственно регистрируются при вводе, или извлекаются из документов (текстов).

Например, на запрос "какова скорость света" в документальной ИПС будут выданы статьи и книги, в которых говорится о скорости света, и возможно, содержится ответ на поставленный вопрос, в фактографической же системе в той или иной форме будет выдано сообщение о том, какова она (299 792 458 м/с).

В документальных системах описывается смысл документов в целом с точки зрения их тематического, предметного содержания. В этом случае важно выявить и назвать (перечислить) основные темы и объекты, которым посвящен документ. В фактографических системах описываются объекты, фиксируются их признаки и значения этих признаков. Отсюда различия в языках описания и способах хранения описаний в системе. Соответственно, для каждого вида поиска существуют свои поисковые средства.

Фактографические системы предполагают накопление и поиск в массиве документов со строго регламентированной структурой. Такая структура является или результатом предварительной интеллектуальной обработки документов при вводе информации в систему, или наличием таких документов в готовом виде в конкретных сферах человеческой деятельности, например, учетные формы, бланки, справочники, расписания и т.п. Существуют фактографические ИПС, которые обеспечивают накопление информации и поиск только по одному типу объектов и только по одному типу запросов. Существуют и более развитые фактографические системы, обеспечивающие хранение и поиск данных, разнообразных по содержанию и структуре, но это разнообразие всегда конечно.

В настоящее время фактографические ИПС строятся на основе технологий баз данных (БД).

С теоретической точки зрения база данныхпредставляет собой совокупность признаков описываемых объектов с указанием отношений между ними. В качестве описываемого объекта может выступать, например, книга, телефонный номер и пр. Объект в базе данных характеризуется по признакам или атрибутам. Так, книга может иметь следующие атрибуты:

  • автор;
  • название;
  • год выхода;
  • издательство;
  • тираж;
  • объем.

Телефонный номер может характеризоваться по фамилии владельца, месту его проживания, сумме абонементной оплаты и т. д.

Базы данных по своей структуре разделяются на иерархические, сетевые и реляционные.

Иерархические БД используются только по отношению к таким проблемным областям, в которых характеристики объектов имеют четкую иерархию. Таковыми могут быть, например, БД по химическим веществам, по деталям машин; четко выраженную иерархию имеют биологические классификации. В существенно меньшей степени выражена иерархическая структура для БД с разнородной информацией.

Сетевые БД лишены ограничений на структуру атрибутов, однако программная обработка сети представляет определенные сложности.

Наиболее распространены в настоящее время реляционные БД, которые можно представить в виде таблиц с очень большим количеством строк и столбцов. Несколько таблиц могут быть связаны между собой перекрестными отсылками, что позволяет формировать довольно сложные БД. Для создания структуры данных, ввода информации в реляционные БД и ее обработки создаются специальные программные средства – системы управления базами данных (СУБД). С программной точки зрения каждый объект в реляционной БД представляется в виде отдельной записи (record). Атрибутам объекта в записи соответствуют поля (fields). Поиск может происходить по всем полям БД. Типы полей различаются.

Основная проблема заключается в том, что у полей записи (кроме полей типа memo) ограничена и фиксирована длина поля. Так, для поля типа textона не должна превышать 255 знаков. Иными словами, атрибуты объекта описания в БД должны быть внимательно проанализированы, чтобы поле не было избыточным по длине, поскольку это значительно увеличивает объем используемой памяти компьютера. Дело в том, что незаполненные фрагменты поля все равно заносятся в память. С другой стороны, поле не должно быть и излишне коротким, иначе часть информации невозможно будет ввести в БД.

Выделяют еще и третий тип систем, которые называют информационно-логическими. Это системы, отвечающие на запросы, на которые в информационной базе в явном виде ответа нет. Получить ответ помогает экстралингвистическая база знаний и информация, порождаемая алгоритмически из уже имеющейся (документальной или фактографической). Эта новая информация или выдается как ответ на запрос или дополнительно используется для поиска. Теоретически системы этого типа, как класс, исследуются и разрабатываются давно. На практике же они сравнительно редки и некоторые из них представляет собой развитие традиционных документальных и фактографических ИПС. В целом, эти системы весьма различны. Среди них можно назвать интеллектуальные диалоговые ИПС, экспертные системы, расчетно-логические, системы (поддержки) принятия решений, базы знаний, системы искусственного интеллекта. Кроме того, подобные "разумные" системы разрабатываются как информационные подсистемы в составе разнообразных систем автоматизации – как прикладного характера, так и системного (например, общение с компьютером на естественном языке).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.Типы ИПС

Существует различные классификации ИПС по различным основаниям:

Информация о работе Информационно поисковые системы