Семантическая паутина

Автор работы: Пользователь скрыл имя, 14 Января 2012 в 03:11, реферат

Описание работы

Всемирная паутина (англ. World Wide Web) — распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Всемирную паутину образуют миллионы web-серверов. Большинство ресурсов всемирной паутины представляет собой гипертекст. Гипертекстовые документы, размещаемые во всемирной паутине, называются web-страницами. Несколько web-страниц, объединенных общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же web-сервере, называются web-сайтом. Для загрузки и просмотра web-страниц используются специальные программы — браузеры.

Содержание работы

Всемирная паутина 3
Определение 3
Структура и принципы всемирной паутины 3
Семантическая Паутина. 5
Определение 5
Структура и основные принципы семантической паутины 6
Resource Description Framework 7
Примеры словарей 13
Критика 14
Практическая нереализуемость 14
Дублирование информации 14
Невозможность получения коммерческой выгоды 14
Вывод. 15
Используемая литература 17

Файлы: 1 файл

Семантическая паутина.doc

— 216.50 Кб (Скачать файл)

Российский  Государственный  Социальный Университет 
 
 
 
 
 

Реферат на тему: Семантическая  паутина 
 

                Выполнил: студент группы.

                Проверил: д.п.н., проф. 
                 
                 
                 
                 
                 
                 
                 

Москва 2011

Оглавление

 

Всемирная паутина

Определение

     Всемирная паутина (англ. World Wide Web) — распределенная система, предоставляющая доступ к  связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Всемирную  паутину образуют миллионы web-серверов. Большинство ресурсов всемирной паутины представляет собой гипертекст. Гипертекстовые документы, размещаемые во всемирной паутине, называются web-страницами. Несколько web-страниц, объединенных общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же web-сервере, называются web-сайтом. Для загрузки и просмотра web-страниц используются специальные программы — браузеры. Всемирная паутина вызвала настоящую революцию в информационных технологиях и бум в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину, однако важно понимать, что это не одно и то же. Для обозначения Всемирной паутины также используют слово «веб» (англ. web) и аббревиатуру «WWW».

Структура и принципы всемирной паутины

     Всемирную паутину образуют миллионы веб-серверов сети Интернет, расположенных по всему  миру. Веб-сервер является программой, запускаемой на подключённом к сети компьютере и использующей протокол HTTP для передачи данных. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Для идентификации ресурсов (зачастую файлов или их частей) во Всемирной паутине используются единообразные идентификаторы ресурсов URI (англ. Uniform Resource Identifier). Для определения местонахождения ресурсов в сети используются единообразные локаторы ресурсов URL (англ. Uniform Resource Locator). Такие URL-локаторы сочетают в себе технологию идентификации URI и систему доменных имён DNS (англ. Domain Name System) — доменное имя (или непосредственно IP-адрес в числовой записи) входит в состав URL для обозначения компьютера (точнее — одного из его сетевых интерфейсов), который исполняет код нужного веб-сервера.

     Для обзора информации, полученной от веб-сервера, на клиентском компьютере применяется  специальная программа — веб-браузер. Основная функция веб-браузера —  отображение гипертекста. Всемирная  паутина неразрывно связана с понятиями гипертекста и гиперссылки. Большая часть информации в Вебе представляет собой именно гипертекст. Для облегчения создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык HTML (англ. HyperText Markup Language), язык разметки гипертекста. В гипертекст веб-страниц добавляются гиперссылки. Гиперссылки помогают пользователям Всемирной паутины легко перемещаться между ресурсами (файлами) вне зависимости от того, находятся ресурсы на локальном компьютере или на удалённом сервере. Гиперссылки веба основаны на технологии URL.

 

Семантическая Паутина.

Определение

     Популярная  концепция развития Всемирной паутины  — создание семантической паутины.

     Термин  «семантическая паутина» был впервые  введён сэром Тимом Бернерсом-Ли, одим  из основателейвсемирной паутины как таковой, в мае 2001 года в журнале «Scientific American», и называется им «следующим шагом в развитии Всемирной паутины». Эта концепция была принята и продвигается Консорциумом Всемирной паутины.

     Так что же такое «Семантическая паутина»?

     Представьте себе сценарий, что информацию, размещенную  на веб-страницах, смогут обрабатывать компьютеры, смогут строить сложные  пути поиска и делать выводы (с минимальным  участием человека). Например, вы ввели  в поисковую строку слово “молоко”, а вам в ответ вернули список магазинов, где его можно купить с учетом ваших личных предпочтений и маршрута домой. А еще неплохо, если ваш компьютер свяжется с сайтом магазина и зарезервирует для вас пару пакетов молока. Это конечно шутка и мечта, но она становится ближе. Никто не говорит, что с появлением семантического веб, появится тот самый многострадальный искусственный интеллект: компьютеры никогда не смогут выполнять анализ текста на странице, максимум, что мы можем сделать - это добавить к публикуемой информации помимо визуального оформления (нужного для восприятия страницы человеком) немножко той информации, которую будет понимать и компьютер.

     Таким образом, Семантиическая паутиина (англ. Semantic Web) — это направление развития Всемирной паутины, целью которого является представление информации в виде, пригодном для машинной обработки.

Структура и основные принципы семантической паутины

     Семантическая Паутина тесно связана с понятием семантической сети (способе представления  информации об устройстве некоторой предметной области). С точки зрения математики он представляется в виде графа, вершинами которого являются некоторые понятия (люди, документы, события), а дуги указывают на отношения, существующие между этими понятиями. Основной упор в Семантическом Web делается на метаинформацию (информацию об информации). Она должна потеснить с трона используемый сейчас метод поиска информации в internet основанный на анализе текста веб-страниц. Для продвижения идей Semantic Web были сформированы новые стандарты, которые строятся на известных и опробованных в internet технологиях, таких как http, xml, xml schema. И что самое главное в последнее время произошел переход теории в практику, когда многие популярные веб-сайты начали при публикации информации выполнять ее разметку в соответствии с идеями Semantic Web. Поддержка появилась и в бесплатном web-инструментарии: движках сайтов, блогов, веб-служб. Это очень важный момент, так как тогда семантическую информацию будет публиковать не специалист в данной области, а обычный человек, вообще ничего и никогда не слышавший о Семантической Сети и лежащих в ее основе технологиях: все нужные теги будут сформированы автоматически. Пирамида семантической пирамиды строится на основе трех форматов: XML (extensible markup language), RDF (Resource Description Framework) и OWL (Web Ontology Language). Как вы знаете, язык XML позволяет создавать собственные теги несущие особое значение, например, вы могли бы внедрить в текст вашей веб-страницы такие теги как “<resume>”, “<friends>” или “<address>”. Для хранения информации об вашем адресе, друзьях или резюме. Вот только как машина сможет эти придуманные вами теги проанализировать и понять, что же в них хранится? Здесь поможет формат RDF.

Resource Description Framework

     В основе RDF лежит идея использования специального вида утверждений, с помощью которых мы можем описать некоторый объект. Каждое из высказываний строится по схеме: “субъект — отношение — объект” и в терминологии RDF называется триплетом. Например, утверждение “Саша любит мандарины” будет представлено в стиле RDF как тройка: субъект — “Саша”, отношение — “любит”, объект — “мандарины”. В свою очередь объект “мандарины” может учувствовать еще в одном отношении, например “В Китае выращивают мандарины”. Остается только догадываться, что такое «мандарины» и кто такой Саша, а также какая связь между Китаем и Сашей. Для идентификации субъектов, предикатов и объектов в RDF используются URI (Uniform Resource Identifier). URI – это основа сегодняшнего internet, но пока используется только для представления адресов веб-страниц, в перспективе возможно указать с помощью URI на географический регион, улицу, человека. Надо только договориться об используемых форматах кодирования такой информации. Более того, и в качестве “отношения” также может выступать URI (указывая на какой-то адрес в сети) и, таким образом, мы можем определять новые и новые отношения. Надо сказать, что с помощью RDF мы можем записывать и более сложные отношения, например четверка: “Сашин друг Чингис не любит мандарины” будет записана как две тройки понятий: “Чингис Саши”, “Чингис не любит мандарины”.

     RDF – это язык описания отношений,  для которого существует несколько  различных форматов представления.  Наиболее известная Нотация Три  (N3) и XML-подобная форма записи. Мы можем писать код “руками” или использовать специальные инструменты. Как стандарт RDF был принят в начале 2004 г.

       Следующий документ содержит  сведения о “Саше”, цвете его волос и дате рождения:

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:ns="http://family.site.com/#" >

  <ns:Person rdf:about="http://family.site.com/#Sasha">

    <ns:hairColor>black</ns:hairColor>

    <ns:birthDay>01.01.1990</ns:birthDay>

 </ns:Person>

</rdf:RDF>

     RDF документ должен начинаться с корневого тега <rdf:RDF. В качестве атрибутов этого тега идет перечисление пространств имен, которые будут далее использованы. Все теги или атрибуты имеют сложносоставные имена, первая часть которых называется пространством имен.

     Когда говорят что XML технология, где мы сами придумываем теги, то немного лукавят: пока вы лично используете этот документ и не обмениваетесь хранящейся в нем информацией с другими людьми, то вы можете использовать любые теги и атрибуты. Но как только информация становится общедоступной, необходимы правила, где указываются какие элементы, могут встречаться в документе, какие у них могут быть атрибуты и за это отвевает технологии XML Namespaces и XML Schema. С помощью префикса указываемого перед именем тега, например, “war:rocket” и “sport:rocket” мы можем отличить ракетку, которой играют в теннис, и ту которую запускают во врага/ Конкретные названия префиксов пространств имен не имеют никакого значения.

       Итак, префиксы могут быть любыми, так что же является критерием  отличия тегов? Самое главное указать при первом использовании тега из нового пространства имен его уникальный идентификатор: xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#. Затем необходимо указать на ту сущность, которую мы хотим описать. За это отвечает тег “rdf:Description”. Таких тегов может быть несколько, и мы должны описать характеристики каждой из этих сущностей. Делается это с помощью вложенных тегов принадлежащих еще одному пространству имен (в примере это теги ns:hairColor и ns:birthDay). Можно записать сведения о человеке и с помощью атрибутов (следующий документ является идентичным приведенному ранее).

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:ns="http://family.site.com/#" >

 <ns:Person rdf:about="http://family.site.com/#Sasha"

ns:hairColor="black"

ns:birthDay="01.01.1991"/>

</rdf:RDF>

     Описание  атрибутов hairColor и birthDay можно найти  в другой XML схеме (ее идентификатор “ http://family.site.com/#”). Но вот что такое “black” и что такое “01.01.1990”. Люди прекрасно понимают значение цвета “чёрный” и даты “01.01.1990” – машины нет. Но мы можем пойти дальше и для некоторых атрибутов указать в качестве значения не просто кусочек текста (такая информация является локальной для этого документа и не может быть полезной для других веб-приложений), мы можем указать URI, например, так:

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:ns="http://family.site.com/#" xmlns:dates="http://calendar.site.com/#">

 <ns:Person rdf:about="http://family.site.com/#Sasha" >

  <ns:hasColor rdf:resource="http://colors.site.com/black" />

 </ns:Person>

</rdf:RDF>

     Теперь  добавим нашему человеку сведения о том, с кем он дружит.

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:ns="http://family.site.com/#">

<ns:Person rdf:about="http://family.site.com/#Sasha" ns:birthDay="01.01.1990">

<ns:hairColor rdf:resource="http://colors.site.com/black"/>

<ns:hasFriend>

<ns:Person rdf:about="http://family.site.com/#Chingis"/>

</ns:hasFriend>

</ns:Person>

</rdf:RDF>

     Эти сведения будут представлены в виде таблицы следующего вида:

А результат  графического представления подобного  описаний информации показан на рисунке. 

 

     Более сложный пример: 

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:ns="http://family.site.com/#">

<ns:Person rdf:about="http://family.site.com/#Sasha" ns:birthDay="01.01.1990">

  <ns:hairColor rdf:resource="http://colors.site.com/black"/>

  <ns:hasFriend>

    <ns:Person rdf:about="http://family.site.com/#Chingis" ns:BirthDay="13.01.1991">

Информация о работе Семантическая паутина