Архивация данных

Автор работы: Пользователь скрыл имя, 23 Июня 2013 в 13:18, курсовая работа

Описание работы

Целью данной курсовой работы является изучение архивации данных и средств ее осуществления.
Задачи:
познакомиться с такими понятиями как «архивация данных», «архиватор»;
изучить существующие алгоритмы сжатия информации;
познакомиться с программами-архиваторами для Windows;
подробно рассмотреть одну из самых популярных программ-архиваторов WinRAR.

Файлы: 1 файл

arkhivatsia_dannykh.docx

— 425.26 Кб (Скачать файл)

Министерство образования  Российской Федерации

ФГАОУ ВПО «УрФУ имени первого Президента России Б.Н.Ельцина»

Институт военно-технического образования и безопасности

Кафедра защиты в чрезвычайных ситуациях

 

 

 

 

 

 

 

 

 

 

 

Курсовая работа по информатике на тему:

Архивация данных

 

 

 

 

 

 

 

Нормоконтроль

Научный руководитель

Курс, группа

Студент

_____________

Суханова Н.Г.

ВБ-120201

Томашова Л.А.


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Екатеринбург

2013

Содержание

 

 

 

 

 

 

 

 

 

 

Введение

Мы живем в веке информационных технологий, где важную роль играет информация. С каждым годом, объем  информации увеличивается, так как мир стремится к открытиям и нововведениям. В нашем веке компьютерных технологий информация занимает огромные объемы памяти. Решением проблемы экономии памяти на носителях является архивация данных, то есть различные способы передачи и хранения информации в сжатом виде.

Целью данной курсовой работы является изучение архивации данных и средств ее осуществления.

Задачи:

  • познакомиться с такими понятиями как «архивация данных», «архиватор»;
  • изучить существующие алгоритмы сжатия информации;
  • познакомиться с программами-архиваторами для Windows;
  • подробно рассмотреть одну из самых популярных программ-архиваторов WinRAR.

В данной работе будут приведены ответы на такие вопросы как:

«Что такое архивация?», «Какие существуют программы-архиваторы?» – и приведу пример способов архивации.

Перед началом работы необходимо ознакомиться с печатными и электронными источниками, которые могут помочь ответить на заданные вопросы.

В ходе написания данной курсовой работы используются знания, приобретенные на занятиях информатики, по использованию программ пакета Microsoft Office.

С помощью программы  Microsoft Word можно создавать, редактировать, форматировать, сохранять и распечатывать документы. Текстовый процессор  Microsoft Word имеет широкий спектр возможностей по созданию документов (вставка списков и таблиц, средства проверки орфографии, сохранение, исправление и др.)

 

  1. Архивация
    1. Электронный архив

Если до создания ЭВМ использовали информацию, написанную вручную или на печатном станке, то в современном мире, где практически у каждого есть персональный компьютер, неудивительно, что все большую популярность набирают электронные архивы.

Электронный архив представляет собой информационную систему, которая  предоставляет многопользовательский  доступ к электронным документам. Электронный архив призван выполнять  следующие функции:

  • создание каталога документов с определенной иерархией;
  • распределение информации по типу документов;
  • хранение документов в электронном виде;
  • обеспечение пользователям доступа к документам;
  • просмотр и работа с электронными копиями;
  • поиск документа как по каталогу, так и по заданным параметрам;
  • резервное копирование документа;
  • печать документов;
  • администрирование системы (регистрация новых пользователей, контроль за работой, наделение правами доступа и т.д.).

Электронный архив и электронный документооборот – не взаимозаменяемые понятия, скорее, они служат в качестве дополнения друг друга. Функции, которые выполняют эти системы, можно сравнить с функциями бумажного архива и документооборота. Данные системы имеют одно основное отличие: архив используется для хранения и поиска информации, менять которую не нужно. Поэтому можно выделить следующие отличия хранения информации в электронном архиве от документооборота:

  • пользователи имеют доступ к информации, но не могут ее менять;
  • все документы находятся на центральном сервере, а пользователям для работы предоставляются электронные копии;
  • пристальное внимание уделяется резервированию и защите информации.

Создавать электронный архив документов следует по следующим причинам:

  1. Удобство. С электронной копией документа намного проще работать: ее легко печатать, пересылать, копировать, а также использовать информацию из нее в других документах.
  2. Простота поиска. В электронном архиве документов намного проще и быстрее найти нужную информацию.
  3. Сохранность. В электронном архиве пользователь работает с копией документа, а потому в отличие от бумажного архива не имеет возможности повредить или утерять оригинал. Кроме того, бумага со временем изнашивается, чего нельзя сказать об электронной копии.
  4. Доступное резервирование. Электронный архив документов дает 100%-ную гарантию, что в чрезвычайных ситуациях вся ваша информация останется в целости и сохранности. Резервирование электронного архива занимает немного времени и обходится намного дешевле, чем резервирование бумажных документов.
  5. Экономия времени. Пользователю не нужно тратить время, чтобы идти на склад и долго искать определенный каталог и информацию в нем. В электронном архиве нужный документ можно найти за считанные минуты. Документы не вывозятся из их обычного места хранения, работы по скоростному сканированию производятся в непосредственной близости с архивным хранилищем заказчика. Изъятия документов из архива не происходит – документ лишь ненадолго покидает архивные полки.
  6. Экономия денежных средств. Проведение массового сканирования документов архива силами специализированной внешней организации значительно дешевле (особенно для больших архивов) за счет исключения затрат на приобретение мощных сканеров и систем ввода, обучение персонала, выделение и оснащение рабочих помещений. Модель «заказчик-исполнитель» оптимальна в терминах цена/качество. На произведенный массив дается гарантия качества сканирования и точности индексации документов.

Все эти преимущества делают создание электронного архива документов все  более популярной услугой.

 

    1. Архивация данных

С развитием электронных  архивов стала актуальна проблема экономичного хранения информации. В связи с этим большую популярность приобрела архивация данных.

Архивация — это подготовительная обработка (сбор, классификация, каталогизация, сжатие) данных для долгосрочного хранения или передачи их по сети.

Архивация файлов — перекодирование данных с целью уменьшения их объёма без значительных информационных потерь.

Архивация чаще всего проводится, когда необходимо создать резервные  копии наиболее ценных файлов, освободить место на диске или же передать файлы по электронной почте.

Электронное архивирование — запись информации в электронном виде для долговременного хранения. Часто его путают с созданием резервных копий данных.

(Резервное копирование (англ. backup) — процесс создания копии данных на носителе (жёстком диске, дискете и т. д.), предназначенном для восстановления данных в оригинальном или новом месте их расположения в случае их повреждения или разрушения.)

Архивный файл представляет собой набор из одного или нескольких файлов, помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве.

В оглавлении архива для  каждого содержащегося в нем  файла хранится следующая информация:

  • имя файла;
  • размер файла на диске и в архиве;
  • сведения о местонахождении файла на диске;
  • дата и время последней модификации файла;
  • код циклического контроля для файла, используемый для проверки целостности архива;
  • степень сжатия.

Любой из архивов имеет  свою шкалу степени сжатия. Чаще всего можно встретить следующую  градацию методов сжатия:

  • без сжатия (соответствует обычному копированию файлов в архив без сжатия);
  • скоростной;
  • быстрый (характеризуется самым быстрым, но наименее плотным сжатием);
  • обычный;
  • хороший;
  • максимальный (максимально возможное сжатие является одновременно и самым медленным методом сжатия).

Степень сжатия зависит от:

  • используемого архиватора;
  • метода сжатия;
  • типа исходного файла.

Степень сжатия характеризуется  коэффициентом сжатия:

 

    ,                                                                                          (1)

 

где    Kc – коэффициент сжатия;

Vc – объем сжатого файла;

Vи – объем исходного файла.

Файлы различных типов  сжимаются по-разному. Например, коэффициент  сжатия текстовых документов значительно  выше, чем графических. Лучше всего архивируются графические файлы в формате .bmp, документы MS Office и Web-страницы. 

Если k = 1, то алгоритм не производит сжатия, то есть выходное сообщение оказывается по объёму равным входному.

Если k < 1, то алгоритм порождает сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу.

Ситуация с k < 1 вполне возможна при сжатии. Принципиально невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал  бы на выходе данные меньшей или  равной длины. Обоснование этого  факта заключается в том, что, поскольку число различных сообщений длиной n бит составляет ровно 2n, число различных сообщений с длиной меньшей или равной n (при наличии хотя бы одного сообщения меньшей длины) будет меньше 2n. Это значит, что невозможно однозначно сопоставить все исходные сообщения сжатым: либо некоторые исходные сообщения не будут иметь сжатого представления, либо нескольким исходным сообщениям будет соответствовать одно и то же сжатое, а значит, их нельзя отличить. Но даже когда алгоритм сжатия увеличивает размер исходных данных, легко добиться того, чтобы их объём гарантировано не мог увеличиться более чем на 1 бит. То есть сделать так, чтобы даже в самом худшем случае имело место неравенство:

K=So/(So+1)

Делается это следующим  образом: если объём сжатых данных меньше объёма исходных, возвращаются сжатые данные путем добавления к ним  «1», иначе возвращаем исходные данные, добавив к ним «0». Коэффициент  сжатия может быть как постоянным (некоторые алгоритмы сжатия звука, изображения и т. п.), так и переменным. Во втором случае он может быть определён либо для каждого конкретного сообщения, либо оценён по некоторым критериям:

  • средний (обычно по некоторому тестовому набору данных);
  • максимальный (случай наилучшего сжатия);
  • минимальный (случай наихудшего сжатия);

или каким-либо другим. Коэффициент  сжатия с потерями при этом сильно зависит от допустимой погрешности  сжатия или качества, которое обычно выступает как параметр алгоритма. В общем случае постоянный коэффициент  сжатия способны обеспечить только методы сжатия данных с потерями.

Для сжатия файлов используются программы архиваторы.

 

    1. Архиваторы

В настоящее время большинство  из нас часто пользуются всемирной  сетью Internet и сталкиваются с информацией, заархивированной различными программами – архиваторами.

Архиватор – это программа, осуществляющая упаковку одного и более файлов в архив или серию архивов для удобства переноса или хранения, а также распаковку архивов. Многие архиваторы используют сжатие без потерь для уменьшения размера архива.

Работа архиваторов заключается  в следующем: найти повторяющиеся  фрагменты в файлах и записать вместо них информацию о количестве повторяющихся кусков. 

Процесс сжатия файлов называется архивированием. Процесс восстановления сжатых файлов – разархивированием.

Иногда необходимость  архивации возникает при желании  пользователя продублировать информацию как на своем компьютере, так и на дискетах. Архивный файл представляет собой набор из одного или нескольких файлов, помещенных в сжатом виде в единый файл. Для создания архивного файла предназначены специальные программы архивации данных или программы-архиваторы.  Часть из этих программ распространяется бесплатно, часть – на коммерческой основе, но основное количество распространяются как условно бесплатные “Shareware”, т.е. они могут быть получены бесплатно на некоторый срок, с дальнейшей выплатой, как правило, небольшой суммы их

распространителям. Большинство  программ-архиваторов позволяют

создавать многотомные архивы различной размерности. Такого рода

возможность позволяет переносить с помощью дискет с одного компьютера на другой достаточно большие по размерности  программы. Среди наиболее

распространенных программ-архиваторов  можно назвать ARJ, PKZIP, LHA,

PKPAK, PAK, ZIP, RAR, WinZIP и WinRAR.

Современные архиваторы отличаются используемыми алгоритмами, скоростью  работы, степенью сжатия.

Простейшие архиваторы просто последовательно объединяют содержимое файлов в архив. Архив должен также  содержать информацию об именах и  длине оригинальных файлов для их восстановления. Большинство архиваторов  также сохраняют метаданные файлов, предоставляемые операционной системой, такие, как время создания и права доступа.

Информация о работе Архивация данных