Архивация данных для MS DOS

Автор работы: Пользователь скрыл имя, 10 Марта 2010 в 13:15, Не определен

Описание работы

История развития теории сжатия информации 1
Архиваторы MS DOS. 6
PKZIP 8
RAR 8
QUARK 9
GZIP 10
ARJZ 10
Сравнение вресий архиваторов MS DOS и Windows. 14
Литература. 15

Файлы: 1 файл

Архивация данных для MS DOS.doc

— 44.50 Кб (Скачать файл)

      Термины, используемые в архивации

      Add file Добавление (копировние) файла в архив. Если архив не существует, то он создается.

      CRC Код циклического контроля. Специальная функция от всего содержимого файла. Составляется таким образом, что изменить файл так, чтобы его CRC остался неизменным, практически невозможно.

      Exclude selected files При архивации НЕ добавлять в архив определенные файлы.

      Extract files Извлечение файлов из архива без сохранения структуры подкаталогов.

      Extract files with pathnames Извлечение файлов из архива с сохранением структуры подкаталогов.

      Fresh files Добавление в архив новых версий уже имеющихся там файлов.

      Garble (или scramble) files with password Архивация файлов с паролем. Извлечь файлы из такого архива можно, лишь правильно указав пароль.

      Move files Перемещение файлов в архив.

      Multiple volumes Многотомные архивы -- состоящие из нескольких файлов (томов). Удобны при архивации больших комплексов файлов, когда тома архива можно помещать на отдельные дискеты.

      Ratio Степень сжатия файла. Определяется по-разному в различных архиваторах (отношение исходного к сжатому либо наоборот).

      Recurse subdirectories Архивация файлов из заданного каталога и всех его подкаталогов. В архиве сохраняется информация о пути к файлам, и при извлечении их можно выводить не в один каталог, а в соответствующие подкаталоги.

      Self-extract (sfx)archive Самораспаковывающийся архив. Архивный файл имеет расширение .exe .или com, и после его запуска происходит автоматическое извлечение файлов из архива.

      Test integrity Проверка целостности архива, т.е. проверка CRC файлов архива.

      Update files Добавление в архив новых файлов.  

      Архиватор ARJ

      Работает из командной строки. Выполняет все функции по обслуживанию архивов .arj , в т.ч. поддержку многотомных архивов.

      Получить справку по ключам архиватора arj с помощью команд: 
arj(обычная справка)

       
arj /?(подробная справка)
 

      Arj имеет очень большое число ключей. Можно автоматизировать много действий -- создание резервной копии диска, архивирование начиная с какой-то даты, добавление к имени архива текущей даты (arh970821.arj), архивирование файла с конкретного места, несколько уровней сжатия и так далее. В версии 2.55 возможна работа с длинными именами.  
Достоинства: очень большое колличество ключей, что дает возможность автоматизировать большое число функций. Защита архива от повреждений.  
Недостатки: отсутствие диалогового режима, некоторое неудобства работы при наличии какого-то ключа в переменной окружения (ARJ_SW) и строке запуска -- взаимное уничтожение.

      PKZIP

      Работает из командной строки. Различные функции по обслуживанию архивов .zip выполняются разными программами: 
pkzip - помещение файлов в архив

pkunzip - извлечение файлов из архива

zip2exe - создание самораспаковывающегося архива

pkzipfix - восстановление поврежденного архива.

      Изучить справку по работе с архиватором pkzip с помощью команд:

      pkzip /h

      pkunzip /h

      zip2exe /h

      RAR

      Архиватор RAR v2.50 для DOS - Интегрированная программа управления архивами

      RAR - это очень мощное средство для создания архивов и управления ими. Возможности RAR:

  • Полноэкранный интерактивный интерфейс (отключаемый);
  • Поддержка мыши и меню;
  • Поддержка не-RAR архивов;
  • 'Стандартный' интерфейс командной строки;
  • Оригинальный высокоэффективный алгоритм сжатия данных;
  • Специальный алгоритм для сжатия мультимедийных файлов;
  • Лучшая степень упаковки, чем у аналогичных продуктов, за счет использования режима "непрерывного" сжатия;
  • Информация об авторе архива (только в зарегистрированной версии);
  • Самораспаковывающиеся (SFX) обычные и многотомные архивы;
  • Восстановление физически поврежденных архивов;
  • Язык программирования для инсталляционных SFX-архивов;
  • Блокировка, шифрование, список порядка файлов, метки томов и др.

      QUARK

      Quark является архиватором классического типа, использующим LZ77-алгоритм для уплотнения исходных данных путем кодирования повторяющихся последовательностей байт (RSE-алгоритм) с последующим вторичным уплотнением сжатого потока кодами Хаффмана. Подобные методы используют все три лидера в области упаковки данных - архиваторы ARJ, LHA, PkZIP. 
Тем не менее, Quark добивается лучших результатов в компактности данных при скорости лучшей чем
LHA, не меньшей чем у ARJ и не сильно отличающейся от скорости PkZIP, при использовании им т.н. максимальной компрессии данных. Это обусловлено несколькими причинами: 
1) Quark работает с плавающим размером окна от 32Kb до 64Kb (против фиксированных 16Kb у
LHA, и 32Kb у PkZIP и ARJ). 
2) Quark выполняет оптимизацию Первого рода (оптимальность адресов ссылок LZ77) и оптимизацию Второго рода (оптимальность ссылочного покрытия потока). 
3) Quark использует текстовую редукцию для текстовых файлов. 
4) Quark заносит в архив минимум служебной информации, не претендуя на иные аппаратные платформы и операционные системы.

      GZIP

      Gzip сокращает размер заданных файлов используя кодирование Зива-Лемеля (LZ77). Когда возможно, каждый файл замещается файлом с расширением '.gz', при этом сохраняются владелец, режимы, доступ и времена модификации (Другие расширения '-gz' для VMS, 'z' для MSDOS, OS/2, FAT и Atari). Если никаких файлов не указано или имя файла '-', то пакуется стандартный ввод и выдается на стандартный вывод. Gzip пытается паковать только обычные файлы, в частности GZip игнорирует символические ссылки.

       Gzip использует алгоритм Зива-Лемеля также как Zip, PKZIP. Итоговый размер, полученного файла после сжатия, зависит от размера исходного файла и наличия в нем общих подстрок. Обычно, такой текст, как исходный код или английский текст сокращается на 60-70%. Паковка с использованием этого алгоритма обычно лучше, чем при использовании LZW (его использует Compress), кодирование Хаффмана (его использует Pack) или адаптированное кодирование Хаффмана (Compact).

      Упаковка происходит независимо от того увеличился ли размер упакованного файл в сравнении с оригиналом или нет. Причина расширения - несколько байтов для заголовка Gzip файла, плюс 5 байтов для каждого 32К блока, или отношение расширения 0.015% от длины файла. Заметим, что фактическое число занятых на диске блоков уже никогда не возрастает. Gzip сохраняет режимы доступа, владельцев и время модификации файлов при упаковке и распаковке...

      ARJZ

      ARJZ (по воле автора программы произносится как "арж-зет") - это архиватор, основанный на известной программе ARJ Роберта Юнга. В отличие от таких современных средств архивирования, как RAR и UC2, ARJZ использует формат файлов, командную строку и опции, совместимые с одной из самых популярных программ сжатия данных, а это имеет свои преимущества. В частности: 
1) Практически всё программное обеспечение, рассчитанное на вызов ARJ, будет работать так же и с программой ARJZ без всякой модификации. Например, не надо будет переписывать ни
ARCVIEW, ни NC 4.0, ни DN, ни тех .BAT файлов, которые вы могли создать за время пользования ARJ'ем.

2) Для того, чтобы использовать возможности ARJZ'а при работе с вашими старыми архивами, вам совсем не нужно переархивировать их заново.

3) Вы так же почти избавляетесь от необходимости изучать новый архиватор. Зная, как запускается ARJ, вы знаете, как запускается ARJZ.

      Однако, следует иметь в виду, что:

       
1) ARJZ позволяет сжимать файлы, используя более мощные методы, чем оригинальная программа. В этом случае ARJ НЕ СМОЖЕТ ПРОВОДИТЬ ОБРАБОТКУ ПОЛУЧЕННЫХ АРХИВОВ, СВЯЗАННУЮ С РАСПАКОВКОЙ, т.е. деархивирование, тестирование и т.д. В любом случае вы сохраните возможность обновлять и сливать архивы, переименовывать или удалять файлы в них, а так же получать список файлов в архивах.

       
2) ARJZ/UNARJZ с одной стороны, поддерживают не все команды и опции ARJ'а, а с другой - вводят новые и это может создавать проблемы при работе. В действительности такие проблемы встречаются чрезвычайно редко и легко разрешимы. 
 
Достоинства и недостатки

      К достоинствам ARJZ можно отнести:

       1) Версии под DOS (реальный/расширенный режимы), OS/2 и NT. В программу для расширенного режима DOS встроен расширитель, поэтому она работает на компьютерах 386+ без какого-либо дополнительного программного обеспечения.

       2) Высокую скорость сжатия: ARJZ сжимает файлы с тем же качеством, что и ARJ примерно в полтора раза быстрее последнего (кроме версии, работающей в реальном режиме).

       3) Высокую степень сжатия (в этом случае полученные архивы не будут распаковываться ARJ'ем). По этому параметру ARJZ находится на уровне RAR/UC2 (в этом вы можете убедится сами - you see too ;-).

      4) Так называемый "полуэкранный интерфейс". ARJZ может во время работы выводить на экран окошко с двумя индикаторами процесса, именем архива и именем пакуемого файла - это замечательная особенность предназначена специально для таких программ, как ARC- или ARJVIEW, SHEZ, ARJMENU, NC 4.0+, DN и др.

      5) Здесь, конечно не место для описания преимуществ UNARJZ'а, но тем не менее... Высокая скорость распаковки. Даже на XT UNARJZ работает в среднем в 1.5-2 раза быстрее, чем ARJ, а при использовании специальной опции (см. UNARJZ.DOC) разница возрастает ещё в два раза.

      Важно отметить, что процедуры деархиватора оптимизированы отдельно под процессоры 286, 386, 486 и Pentium.

    1. ARJZ написан таким образом, что его можно использовать и как отдельный архиватор и как надстройку над ARJ'ем: если он не может распознать команд или опций командной строки, то запускает оригинальную программу. Это, фактически, означает, что, используя ARJZ, вы, тем не менее, не теряете ни одной опции ARJ'а. 
       
      Недостатки ARJZ:

     
    1) В ARJZ (по крайней мере, пока) нет поддержки многотомных (multi volume), резервных (backup) и самораспакующихся (SFX) архивов. Заметьте, что UNARJZ распаковывает любые архивы, созданные ARJ. 
    2) ARJZ не является полноценным архиватором в том смысле, что он самостоятельно не удаляет и не переименовывает файлы в архивах, не может сливать архивы и т.д. Всю эту работу можно сделать с помощью оригинальной программы, поэтому нельзя говорить, что пара ARJZ/UNARJZ полностью заменяет собой
    ARJ. 

      Далее будут кратко рассмотрены менее популярные архиваторы, которые, однако все еще используются в среде MS DOS. 

      Arhangel -- этот архиватор базируется на архиваторе HA, но несовместим с ним. По заявлению создателей этот архиватор наиболее подходит для сжатия изображений (TIFF, BMP).  
Достоинства: хорошее сжатие графической информации.  
Недостатки: обилие ключей для установки максимального сжатия -- просто теряешся какой выбрать.

      JAR -- новый архиватор из семейства ARJ. У меня он показал более плохие результаты, нежели WinRAR, хотя в документации сказано, что "это лучший архиватор в терминах компрессии". Другие тесты тоже, вроде, подтверждают, что этот архиватор лучше WinRAR и других подобных, но он, безусловно, не занимает первое место. Возможности примерно такие же, как и у ARJ.  
Достоинства: достаточно быстрая работа, поддержка recovery record -- возможность восстановления сбойных архивов.  
Недостатки: нет диалогового режима работы.

Информация о работе Архивация данных для MS DOS