Электронная почта. Разработка системы автоматической фильтрации нежелательной электронной корреспонденции

Автор работы: Пользователь скрыл имя, 23 Марта 2011 в 22:31, курсовая работа

Описание работы

Целью предложенной курсовой работы - освятить такие моменты, как назначение и принципы функционирования электронной почты, а также предложить методы борьбы с любую нежелательной электронной информацией, получаемой пользователем.

Для этого потребуется решить ряд задач:

1. Рассмотреть общие характеристики электронной почты

2. Сравнить наиболее известные почтовые программы

3. Проследить технологию функционирования электронной почты

4. Обзор архитектуры системы фильтрации спам-сообщений (спам-фильтра), и описание комбинированного метода фильтрации, основанного на сочетании известных алгоритмов.

Содержание работы

Введение…………………………………………………………………………3

Глава 1. Общие характеристики электронной почты…………………………6

1. 1 Технология функционирования электронной почты……………………13

1.1.1. Получение и отправка сообщений………………………………………13

1.1.2. Адресная книга……………………………………………………………18

1.1.3. Работа с вложениями……………………………………………………..20

1.1.4. Безопасность электронной почты………………………………………..23

Глава 2. Почтовые программы-клиенты……………………………………….26

Заключение……………………………………………………………………….37

Список литературы………………………………………………………………39

Файлы: 1 файл

курсач по ис.doc

— 1.47 Мб (Скачать файл)

В настоящее  время в нашей стране на разных компьютерах используются множество  различных кодировок русских  букв: самые популярные из них это:

Кодировка KOI8 (RFC1489) - используется в большинстве OS UNIX (charset=KOI8-R);

С легкой руки КИЯИ - RELCOM'a (родоначальника Internet в нашей  стране) эта кодировка получила название "Русская сетевая кодировка" (Russian Network Code). Кодировка зарегистрирована в Internet Architecture Board (IAB) в июле 1993 г. (см. RFC1489 ).

Русские буквы  в кодовой таблице KOI8-R

В данной таблице указано расположение русских  букв в второй половине расширенной  кодовой таблицы.

Преимущество  данной кодировки в том, что она  не имеет разрывов - недостатки в  том, что она лексиграфически  не упорядочена.  

Кодировка MS DOS (CP866) - используется в OS MS DOS 6.22 для IBM PC (charset=x-CP866);

Ввиду гигантской экспансии фирмы Microsoft на Российский и Восточноевропейский рынок эта кодировка является в настоящее время самой популярной (распространенной в сети Internet) кодировкой русских букв в стране.

Русские буквы  в кодовой таблице MS Windows

В данной таблице указано расположение русских  букв в второй половине расширенной  кодовой таблицы.

Преимущество  данной кодировки в том, что она  не имеет разрывов и лексиграфически  упорядочена, однако до сих пор не "узаконена".

Кодировка ISO-8859-5 - используется в DEC (charset=ISO 8859-5);

Единственная "узаконенная" международной организацией стандартизации (ISO) кодировка русского языка. Используется на больших UNIX машинах (в основном фирм DEC и Sun Microsystems). (см. RFC1345, RFC1700).

Русские буквы  в кодовой таблице ISO 8859-5

В данной таблице указано расположение русских  букв в второй половине расширенной  кодовой таблицы.

Стандарт ISO 8859-5 определяет однобайтную восьмибитную кодировку символов кириллицы и  латинского алфавита ISO/IEC 8859-5:1988 (Information Processing - 8-bit single-byte coded graphic character sets - Part 5: Latin/Cyrillic alphabet).

Кодировка русского языка MS Windows СР1251 предложена фирмой Microsoft для своих продуктов.

Ввиду гигантской экспансии фирмы Microsoft на Российский и Восточноевропейский рынок  эта кодировка является в настоящее  время самой популярной (распространенной в сети Internet) кодировкой русских букв в стране.

Русские буквы  в кодовой таблице MS Windows

В данной таблице указано расположение русских  букв в второй половине расширенной кодовой таблицы.

Преимущество  данной кодировки в том, что она  не имеет разрывов и лексиграфически  упорядочена, однако до сих пор не "узаконена".

Кроме них существуют еще кодировка MacOS, а также почти  забытая альтернативная кодировка (CP855), и уже совсем забытые кодировки основная (или болгарская) и ГОСТ.

Из всех перечисленных  кодировок только кодировка ISO8859-5 «узаконена»  Международной Организацией по Стандартизации (ISO), но, к сожалению, она очень редко используется на современных компьютерах.

Сеть Internet развивалась  первоначально как сеть UNIX машин  и унаследовала все свойства представления  информации в OS UNIX. Для передачи информации первоначально использовался только 7 битный код (т.е. передавалась только первая половина кодовой таблицы). Позже были разработаны различные способы передачи всей кодовой таблицы (transfer encoding=8 bit).

Наследие UNIX'а  коснулось и системы передачи электронной почты. Неписанным телекоммуникационным стандартом передачи русских букв изначально стал стандарт OS UNIX кодировка KOI8. Практически все почтовые оболочки (изначально разработанные для MS DOS) перекодировали DOS'овскую кодировку CP855 в KOI8 и после этого передавали сообщение.

Такое единообразие нарушилось с появлением в нашей  стране других сетей, входящих в систему Internet, таких как HEPNet (Radio-MSU) (этой сети принадлежит «Сеть Internet Новосибирского научного центра»), FreeNet, RUNNet (сеть университетов России) и др., и новых операционных систем, таких как MS Windows NT, MacOS, OS/2 и др. и системы передачи всей кодовой таблицы. Начиная с 1995 года, старая система передачи русских сообщений стала постоянно давать сбои и корреспонденты то и дело вместо русского текста стали получать абракадабру, которую правда можно было расшифровать, или хуже всего сплошные квадратики (или точки), которые уже не поддавались расшифровке. Тем самым единый способ перекодировки русских букв оказался неприемлемым для использования в передаче почтовых сообщений.

Адрес электронной  почты, так же как и обычный  почтовый адрес должен содержать всю необходимую информацию для того, чтобы письмо дошло до адресата из любой части земного шара. Точно так же, как и почтовый, электронный адрес состоит из двух частей:

раздел «Куда» - содержит указание на хост-компьютер;

раздел «Кому» - содержит учетное имя абонента.

В разных системах используются различные способы  представления адреса. Например, в  системе INTERNET и совместимых с  ней разделы «Кому» и «Куда» разделены  знаком «@», причем слева указывается  «Кому». Например:

user@adonis.iasnet.ru,

где user - учетное  имя абонента, а adonis.iasnet.ru - имя хост-компьютера

(adonis) и указание, как его найти. 

Раздел «Куда» имеет иерархическую структуру. Уровни иерархии называются доменами (domain - владение, сфера деятельности) и разделены точками. Количество доменов в адресе, вообще говоря, не ограничено. Самый правый домен представляет собой домен верхнего уровня. В данном случае, ru - код России. Для всех стран существуют двухбуквенные коды. Например:

au - Австралия,

br - Бразилия,

by - Беларусь,

ca - Канада,

cn - Китай,

de - Германия,

jp - Япония,

ua - Украина,

uk - Великобритания,

us - США.

Домен верхнего уровня не обязательно является кодом  страны. Ниже приведены примеры нескольких доменов верхнего уровня, используемых в США:

COM - коммерческие организации и бизнес;

EDU - образовательные  учреждения;

NET - структурные  организации системы;

ORG - неприбыльные  организации;

INT - международный  домен.

Домен второго  уровня дает уточнение для поиска хост компьютера. Это может быть код города или региона, в США - штата. В приведенном выше примере домен второго уровня указывает на компьютерную сеть Института Автоматизированных систем (iasnet). 
 

1.1 Технология функционирования электронной почты

1.1.1. Получение и отправка сообщений

Системы электронной почты работают с сообщениями. В отличие от обычных писем, сообщение нельзя рассматривать как отдельный физический объект, например, файл. Каждый почтовый сервер может хранить сообщения в особом формате, но все вместе они рассматриваются как база данных. Все операции с сообщениями – это, по сути, операции с базой данных. Получение почты и отправка сообщений – это операции синхронизации баз данных, одна из которых располагается на нашем компьютере, а другая – на почтовом сервере. Таким образом, сообщение – это запись в базе данных.

Все эти подробности  не имели бы особого значения, если бы не характерный вопрос, который  возникает у каждого, кто пользуется электронной почтой: где находятся  мои сообщения? Поиск файлов, содержащих сообщения, результата не приносит. Тем не менее, почтовая программа без труда находит все сообщения.

Секрет прост: сообщения лежат в базе данных почтовой программы. Как именно и  где хранится эта база данных, не так уж важно. Все, что представлено в почтовой программе, как сообщения  и папки, носит виртуальный характер. Папкам и сообщениям не соответствуют папки и файлы на жестком диске. Даже файловые вложения, имеющиеся в сообщениях, не существуют в виде файлов, пока они не сохранены пользователем отдельно.

Сообщения распределены по папкам. Классический набор почтовых папок – Входящие, Исходящие, Отправленные, Удаленные и Черновики. В некоторых системах, в частности в службах Web-mail, набор стандартных папок может меняться. Кроме того, почтовые программы разрешают создавать дополнительные папки по своему вкусу.

В папку Входящие обычно попадает вся поступающая  корреспонденция. Эту папку используют для чтения почты. Нормальное состояние  папки Исходящие – пустое, в нее на время попадают готовые, но еще не отправленные сообщения. Почту удобно обрабатывать в пакетном режиме, выполняя отправку и получение сообщений периодически. До очередной операции сообщения, готовые к отправке, накапливаются в папке Исходящие включение к Интернету нужно только в момент отправки и получения сообщений.

При небольшом объеме переписки сообщения лучше отправлять сразу по готовности. В системах Web-mail отправка сообщений происходит автоматически, поэтому в них папка Исходящие иногда вообще отсутствует.

После передачи исходящие сообщения переносятся  в папку Отправленные. В этой папке накапливается архив всех успешно отправленных сообщений. Папка Удаленные играет роль Корзины, в которую помещаются сообщения, для которых дана команда на удаление. Пока сообщения остаются в этой папке, их можно восстановить. Очистка шапки Удаленные – это окончательное уничтожение сообщений.

Наконец, папка  Черновики предназначена для  незаконченных сообщений. Иногда написать сообщение «за один прием» не удается. В этом случае его можно сохранить, и оно попадет в папку Черновики, после доработки и отправки сообщения черновик обычно автоматически уничтожается.

Самая простая  операция - это получение сообщений. Соединение с сервером и загрузка поступивших сообщений выполняется автоматически (при установках по умолчанию) и в классической почте E-mail, и почте Web-mail. При работе в Web-mail служба сама организует получение сообщений и при обращении к ней представит их в папке Входящие. Почтовые клиенты E-mail проверяют наличие на сервере новых сообщений при запуске программы и потом через заданные промежутки времени. Для проверки необходимо подключиться к Интернету. Новые сообщения попадают в папку Входящие.

Если настройки  программы не предусматривают автоматического  получения сообщений, эту операцию следует выполнить вручную. В  программе Outlook Express для этого служит кнопка «Доставить почту» на панели инструментов. В программе Mozilla Thunderbird аналогичная по назначению кнопка называется «Получить новые сообщения». Программа свяжется с сервером и проверит содержимое почтового ящика.

Чтобы прочесть сообщения, откройте папку Входящие на панели папок. На экране появится список всех сообщений в выбранной папке. Новые, непрочитанные сообщения выделены полужирным шрифтом.

Если выбрать  сообщение в списке, то его содержание откроется в области предварительного просмотра. На панели в верхней части этой области видна служебная информация (имя отправителя, тема сообщения), а основную часть области занимает текст сообщения. При двойном щелчке на сообщении в списке оно откроется в отдельном окне.

При открытии сообщения в отдельном окне или при продолжительном отображении в области предварительного просмотра сообщение считается прочитанным. При последующих обращениях к программе полужирного выделения не будет.

В системах Web-mail предварительный просмотр обычно не предусмотрен. Сообщения в папке Входящие представлены в виде гиперссылок. При щелчке на ссылке текст сообщения откроется на новой веб-странице.

Основные характеристики сообщения – это имя (адрес) отправителя и тема сообщения. Тема сообщения – это краткое описание его содержания. Именно тема, среди прочего, отображается в списке сообщений, позволяя быстро оценить важность полученного сообщения. Указание темы во всех отправляемых сообщениях – это обязательное требование этикета электронной почты. Отсутствие темы – знак неуважения к корреспонденту. Обычно сообщения с «пустой» темой получатель уничтожает не читая.

Качество описания темы – залог эффективной переписки. Если тема внятно описывает содержание сообщения, партнер будет весьма благодарен. И наоборот, невнятная, неоднозначная или всеохватная тема усложняет переписку и создает неудобства. При длительном Осуждении одного вопроса тема сообщений остается неизменной. Это возможно благодаря средствам автоматизации подготовки ответов.

Отправка сообщений.

Написать ответ на полученное письмо проще, чем подготовить новое сообщение. Когда сообщение выбрано в списке или открыто в отдельном окне, на панели инструментов активируются кнопки Ответить, Ответить всем и Переслать. Такой набор кнопок считается стандартным и предусмотрен во всех почтовых системах и программах.

Информация о работе Электронная почта. Разработка системы автоматической фильтрации нежелательной электронной корреспонденции