Автор работы: Пользователь скрыл имя, 04 Октября 2009 в 20:39, Не определен
Основные понятия теории информационных систем в экономике
Ссылки WWW указывают не только на документы, специфичные для самой WWW, но и на прочие сервисы и информационные ресурсы Internet.
Программные средства WWW являются универсальными для различных сервисов Internet, а сама информационная система WWW играет интегрирующую роль.
Некоторые термины, использующиеся в WWW :
html (hypertext markup language, язык разметки гипертекста) - формат гипермедийных документов, использующихся в WWW для представления информации. Формат этот не описывает то, как документ должен выглядеть, но его структуру и связи. Внешний вид документа на экране пользователя определяется программой - навигатором, и если Вы работаете за графическим или текстовым терминалом, то в каждом случае документ будет выглядеть по-своему, но структура его останется неизменной, поскольку она задана форматом html. Имена файлов в формате html обычно оканчиваются на html (или имеют расширение htm в случае, если сервер работает под MS-DOS или Windows).
http (hypertext transfer protocol, протокол передачи гипертекста) - название протокола, по которому взаимодействуют клиент и сервер WWW.
WWW - сервис прямого доступа, требующий полноценного подключения к Internet, и более того, часто требующий быстрых линий связи, в случае, если документы, которые Вы читаете, содержат много графики или другой нетекстовой информации.
Ограничениями и недостатками WWW:
Во-первых, соединение между клиентом и сервером WWW одноразовое: клиент посылает запрос, сервер выдает документ, и связь прерывается. Это значит, что сервер не имеет механизма уведомления клиента об изменении или поступлении новых данных.
Следующая
проблема WWW - недостаточность языка
описания документов html для решения многих
задач. Например, html не предусматривает
вывод математических символов, и текста,
уменьшенного, по сравнению со стандартным,
размера. Эта задача решается тем же
образом, что и предыдущая - разработкой
новых версий языка html и новых типов
навигаторов, расширяемых произвольным
образом.
3.
АДРЕСАЦИЯ В
INTERNET
3.1.Система адресации в Internet
К адресам станций в Internet предъявляются специальные требования. Адрес должен обрабатываться автоматически, т.е. быть цифровым, а также должен нести некоторую информацию о своем владельце. С этой целью для каждого компьютера устанавливается два адреса: цифровой и доменный (символьные).
Цифровой
адрес называют IP - адресом (IP - Internetwork
Protocol - межсетевой протокол). Он состоит
из четырех целых чисел, каждое из которых
не превышает значение 256. При записи числа
отделяются друг от друга точками,
например, 194.84.93.10. Начало адреса определяет
часть Internet, к которой подключен компьютер,
а окончание - адрес компьютера в этой
части сети. Цифровые адреса используются
при настройке Internet, в дальнейшей работе
можно пользоваться символьными именами,
хотя можно применять и IP - адреса. Преобразование
имени в цифровой адрес происходит автоматически.
При вводе символьного имени наш компьютер
обращается к серверам DNS (Domain Name System -Доменная
система имен), которые хранят информацию
о соответствии символьных и цифровых
имен. DNS -это база данных, обеспечивающая
преобразование доменных имен компьютеров,
подключенных к Internet, в числовые
IP - адреса.
3.2. Доменная система имен
Система доменных имен DNS строится по иерархическому принципу. Однако эта иерархия не строгая. Фактически нет единого корня для всех доменов Internet.
В системе доменов верхнего уровня в Internet приняты домены, представленные географическими (национальными) регионами. Они имеют имя, состоящее из двух букв. Например, географические домены для некоторых стран: Франция - fr; США - us; Россия - ru.
Существуют и домены, поименованные по тематическим признакам, они имеют трехбуквенное обозначение. Например,
коммерческие организации - com;
правительственные учреждения - gov,
сервисные центры Internet -net,
американские университеты - edu,
военные сети США - mil.
Эта система обозначений пошла из США. В 80 -е годы там, на родине Internet , были определены первые домены верхнего уровня, и это были трехбуквенные обозначения. Затем, когда сеть перешагнула границы США, появились национальные домены (двубуквенные), для СССР был выделен домен su, далее, когда в конце 80 - х республики Советского союза стали самостоятельными, России дали домен ru. Но выбросить домен su из употребления уже нельзя, поскольку на основе доменных имен строятся адреса электронной почты и доступ ко многим ресурсам Internet. Поэтому в России сейчас есть организации с доменными именами ru и su. Сейчас доменные имена с su провайдеры не дают.
Вслед
за доменами верхнего уровня следуют
домены, определяющие или регионы (msk
- Москва), или крупные организации
zitmgu(центр информационных технологий
МГУ). Далее в имени следуют уровни иерархии,
которые могут быть закреплены за небольшими
организациями, либо за подразделениями
больших организации. Всю систему доменной
адресации можно представить на рисунке.
Таким образом, доменное имя для пользоватея
сети Internet может выглядеть так:
info1.zitmgu.ru
или polyn.net.kiae.su
3.3.Универсальные указатели ресурсов
При работе в Internet чаще всего используются не просто доменные адреса, а универсальные указатели (идентификаторы, локаторы) ресурсов, называемые URL - Universal Resource Locator. URL - это адрес любого ресурса в Internet, вместе с указанием того, с помощью какого протокола следует к нему обращаться.
В URL принята следующая схема:
- имя протокола http: //;
-имени машины, где расположен ресурс www.citmgu. ru;
- адрес файла /users/data/Letters.html
схеме, имени протокола доступа к заданному ресурсу, затем -, а справа - после служебных меток (#,?) - имени метки внутри файла или элементов поискового запроса.
Пример. Создадим адрес для обращения по протоколу HTTP к WWW - серверу с доменным именем zitmgu.ru c попыткой доступа к файлу Letters.html в каталоге users, подкаталоге data .
Система чувствительна к регистру в именах, в расширении файлов в может быть более трех символов. Пример адресации:
http: //www.citmgu.ru/users/data/
3.4.Схемы
адресации ресурсов INTERNET
В стандарте RFC - 1630 (Request for Comment - документы с таким названием содержат в себе материалы по Internet - технологиям, которые доведены до уровня стандарта или близки к этому уровню) рассмотрены схемы адресации ресурсов INTERNET, здесь рассмотрим некоторые, практически самые употребляемые.
Схема HTTP (Hyper Text Transfer Protocol) - основная схема (протокол) для WWW - технологий. Серверы, работающие на языке протокола HTTP, называются HTTP - серверами или WEB - серверами.
Нами
уже рассмотрен пример адресации
ресурса по протоколу HTTP. Напомним,
что такой адрес может
http://paul.net.kiae.su/
В данном примере предполагается, что указанный документ kadr.html - это документ с возможностью поиска по ключевым словам (после вопросительного знака указано ключевое слово keyword1). Чаще всего указывается только имя ресурса без меток и ключевых слов. Если имя файла неизвестно, можно обратиться к соответствующему серверу, получить на экран его исходную страницу и воспользоваться подсказками для поиска нужной информации. Как правило, исходные страницы WEB - серверов обязательно содержат понятные подсказки в виде красочных меню.
Схема FTP. Эта схема также позволяет адресовать файловые архивы FTP из программ-клиентов WWW (броузеров). Известно, что доступ к архивам FTP может быть анонимным (неавторизованный доступ) и авторизованный доступ, когда надо указывать идентификатор пользователя и даже его пароль. Неавторизованный доступ возможен только к публичным, некоммерческим архивам. В связи с этим возможны два варианта адресации:
Неавторизованный
доступ: ftp://polyn.net.kiae.su/pub/
В
данном случае записана ссылка на ресурс
с подразумеваемым
Авторизованный доступ:
ftp://nobody1:password@
В
данном случае идентификатор (nobody1) и пароль
(password) отделены от адреса машины символом
"@". По введенной команде указанный
файл будет (в случае успешного обнаружения)
передан на ваш компьютер. Если Вы не знаете
точное имя ресурса, но Вам известно
имя FTP - сервера, на котором он расположен,
можно обратиться к исходной
4.
ПОИСКОВЫЕ СИСТЕМЫ
В WORLD WIDE WEB
Работа поисковых серверов основывается на трех основных принципах: создание Web-индексов (Web-indexes), создание каталогов (Web directories) и метод, сочетающий в себе таким или иным образом оба первых подхода. Существуют еще разнообразные онлайновые справочники, системы на компакт-дисках и т.д.
Создание Web-индексов предполагает поиск, анализ, классификацию и пополнение данных. Все это выполняется исключительно компьютерами, поэтому в ответ на запрос они выдают ссылки на большое количество документов, многие из которых имеют отдаленное отношение к интересующей теме. Примерами в этой области являются Yandex, AltaVista и HotBot, а также Open Text. Необходимо заметить, что AltaVista и Yandex являются поисковыми системами, работающими с русскоязычными документами.
Второй
подход подразумевает
В качестве примеров, сочетающих в себе использование и Web-индексов и Web-каталогов, можно назвать Rambler, Lycos и Excite, также WebCrawler.
В сети постоянно появляется что-то новое, в том числе и поисковые системы.
Как уже отмечалось ранее - поиск можно производить также с помощью альтернативных средств, среди которых онлайновые справочники, конференции новостей, специализированные системы/справочники, разнообразные классификаторы, сгруппированные в различные "белые", "желтые" и другие страницы. Существуют внесетевые справочники, представленные на компакт-дисках или дискетах. Это локалLЀные базы данных сетевых ресурсов, помогающие ко всему прочему еще экономить деньги, так как с их помощью производится предварительный поиск нужных ресурсов, только после этого производится соединение с Internet. Можно предложить осуществлять поиск по ссылкам, рекламным объявлениям и другим сообщениям в сети. Альтернативные формы могут оказться более эффективными, чем поисковые системы.
В
зависимости от того, какой поисковой
системой Вы пользуетесь, на запрос она
может выдавать только заголовок
и адрес каждой найденной страницы
либо производить выделение