Мультимедийные технологии

Автор работы: Пользователь скрыл имя, 30 Января 2011 в 05:05, реферат

Описание работы

Для записи изображений требуются достаточно большие объемы памяти, часто в единицы и даже десятки Мегабайт – а, это может оказаться недостижимым, если изображение необходимо записать на дискету или передать по Интернет. Существуют специально разработанные форматы записи графических файлов, практически каждый из которых базируется на том или ином, а иногда и на нескольких алгоритмах сжатия изображений – это является решением проблемы. Посредством сжатия (компрессии) изображений удается в несколько раз и даже в ряде случаев в десятки раз сократить цифровой поток, представляющий изображение.

Содержание работы

1.Проблема сжатия изображений Þ стр. 3
1.1 Оценка качества изображения Þ стр. 3

2.Статистическая избыточность изображений Þ стр. 4
3.Психофизическая избыточность изображений Þ стр. 6
4.Декорреляция сигнала изображения Þ стр. 6
5.Кодирование длин серий Þ стр. 8
6.Кодирование методом LZW Þ стр. 9
6.1 Принципы метода сжатия LZW Þ стр. 9

7.Метод кодирования Хаффмена Þ стр. 10
8.Принципы кодирования с использованием
ортогональных преобразований Þ стр. 11

9.Дискретное косинусное преобразование Þ стр. 15
10.Оптимальное распределение двоичных единиц кода между
спектральными коэффициентами Þ стр. 17

11.Сжатие изображений в формате JPEG Þ стр. 18
Вывод Þ стр. 22

Список литературы Þ стр. 23

Файлы: 1 файл

реферат ММТ.doc

— 477.00 Кб (Скачать файл)

      Второй  метод сокращения требуемого объема вычислений при выполнении дискретного косинусного преобразования состоит в применении быстрого алгоритма вычисления ДКП, при котором требуемый объем вычислений (умножений и сложений) сокращается с до .

      Поясним эффективность этого метода на примере, полагая, что размер блока составляет отсчетов изображения. При непосредственном вычислении спектральных коэффициентов по формулам (3.9, 3.10) потребовалось бы выполнить 65536 операций умножения и сложения. Используя же быстрый алгоритм, потребуется выполнить всего лишь 2048 операций, т.е. в 32 раза меньше, чем в первом случае.

      В настоящее время при выполнении ДКП используют оба описанные  метода сокращения количества вычислительных операций, поскольку они, дополняя друг друга, позволяют существенно ускорить вычисления.

  1. ОПТИМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ДВОИЧНЫХ   ЕДИНИЦ КОДА МЕЖДУ СПЕКТРАЛЬНЫМИ КОЭФФИЦИЕНТАМИ

   В методе, использующем ортогональные преобразования, сжатие данных достигается за счет того, что спектральные коэффициенты, энергия которых мала, квантуются на меньшее число уровней, а, следовательно, на их представление затрачивается меньшее число двоичных единиц кода, чем на представление спектральных коэффициентов с большой энергией.

      Рассмотрим  задачу распределения двоичных единиц кода между спектральными коэффициентами , при котором обеспечивается наименьший средний квадрат шума преобразования , обусловленного квантованием (или отбрасыванием) спектральных коэффициентов. Будем считать, что сжимаемое изображение является черно-белым полутоновым, а также, что нам заданы: размер блока , требуемый коэффициент сжатия и значения средних квадратов спектральных коэффициентов .

      Решение задачи начнем с того, что определим  вначале число двоичных единиц кода , которым мы располагаем при заданном коэффициенте сжатия и которое нам предстоит распределить между спектральными коэффициентами блока. Исходя из того, что для представления каждого пиксела в блоке исходного черно-белого полутонового изображения требуется один байт, т.е. 8 двоичных единиц, найдем, что для представления всего блока без сжатия расходуется двоичных единиц кода. Отсюда следует, что при заданном значении коэффициента сжатия мы располагаем количеством двоичных единиц кода, которые и должны распределить между спектральными коэффициентами.

      Как уже указывалось, средний квадрат  шума квантования прямо пропорционален среднему квадрату квантуемого сигнала. Применительно к рассматриваемому случаю это значит, что средний квадрат шума квантования спектрального коэффициента  будет равен

,                             (3.11)

где - средний квадрат шума квантования сигнала на уровней, при условии, что средний квадрат самого квантуемого сигнала равен единице, а распределение его по яркости описывается плотностью вероятности , - число двоичных единиц кода. Средний же квадрат шума преобразования (квантования), равен сумме средних квадратов шумов, возникающих при квантовании каждого спектрального коэффициента

       .                                             (3.12)

      Для того, чтобы обеспечить минимальное значение , поступим следующим образом. Вначале выделим для представления каждого спектрального коэффициента нулевое количество двоичных единиц кода и найдем значения средних квадратов шумов квантования, которые при этом возникают. Поскольку в этом случае мы совершили усечение (отбрасывание) спектральных коэффициентов, значения средних квадратов шумов квантования будут равны средним квадратам самих спектральных коэффициентов, т.е. , а - их сумме. Далее, выбираем из всех значений самое большое, выделяем спектральному коэффициенту, которому соответствует это самое большое значение среднего квадрата шума квантования, одну двоичную единицу кода, уменьшаем на единицу и рассчитываем для него по формуле (3.11) новое значение среднего квадрата шума квантования . После этого снова сравниваем между собой все значения , опять находим наибольшее и снова выделяем одну двоичную единицу кода наиболее “шумящему” спектральному коэффициенту, уменьшая при этом на единицу. Так повторяем до тех пор, пока не будут израсходованы все двоичные единицы кода . Как не трудно видеть, при таком распределении двоичных единиц мы обеспечиваем минимальный уровень шума преобразования. Заключительным этапом описанной процедуры является объединение спектральных коэффициентов, для представления которых выделено одинаковое количество двоичных единиц кода, в зоны.

      Обратим внимание, что описанный метод  распределения двоичных единиц кода между спектральными коэффициентами еще не гарантирует минимальной заметности шума преобразования на изображении после его декодирования. Объясняется это тем, что различные спектральные компоненты различно воспринимаются зрительной системой. Поэтому для того, чтобы достичь минимальной заметности шума преобразования на декодированном изображении, описанную процедуру необходимо выполнять, используя для этого не средние квадраты шума квантования, а их средневзвешенные значения.

      Рассмотрим, как проявляется шум квантования, а также внешний шум на декодированных изображениях. Поскольку результирующий уровень шума преобразования является результатом одновременного воздействия всех шумовых компонент, возникающих при квантовании спектральных коэффициентов, то в силу центральной предельной теоремы его распределение будет близким к нормальному. Так как средние квадраты шума квантования всех спектральных коэффициентов близки между собой вследствие примененной стратегии распределения двоичных единиц, его спектральный состав будет близок к спектральному составу квазибелого шума. Что же касается проявления на изображении внешней помехи при его передаче по каналу связи в сжатом виде, то здесь все зависит от ее характера. Например, редкая импульсная помеха проявляется в том, что отдельные блоки изображения передаются неверно, поэтому на них пропечатываются базисные изображения, соответствующие тем спектральным коэффициентам, которые были переданы с ошибкой.

11 СЖАТИЕ ИЗОБРАЖЕНИЙ В ФОРМАТЕ  JPEG

 

      В формате записи изображений JPEG использован метод сжатия с применением дискретного косинусного преобразовании, т.е. метод сжатия с потерями информации. Аббревиатура JPEG означает название организации, разработавшей этот стандарт, - Joint Photographic Experts Group (Объединенная группа экспертов по фотографии). Этот формат предусматривает сжатие, как черно-белых полутоновых изображений, так и цветных. Рассмотрим случай сжатия цветных изображений как более общий. В цветном изображении каждый пиксел представлен 3-мя байтами, по байту на красный (R), зеленый (G) и синий (B) цвета.

      Сжатие  изображения начинается с того, что  оно разбивается на отдельные  блоки размером 16х16 отсчетов каждый, которые затем сжимаются независимо друг от друга.

      Далее, в каждом блоке от 3-х матриц отсчетов для красной (R), зеленой (G) и синей (B) компонент изображения, осуществляют переход к 3-м матрицам, представляющим яркостную (Y) и две цветностных (Cb) и (Cr) компоненты изображения. Компоненты (Cb) и (Cr) являются аналогами цветоразностных сигналов в хорошо известной совместимой системе цветного телевидения SECAM. В отличие от компонентов (R),(G),(B) компонент (Y) включает в себя только информацию о яркости пикселов, а компоненты (Cb) и (Cr) содержат информацию только об их цвете и насыщенности этого цвета. Поскольку острота зрения человека при наблюдении чисто хроматических изображений (pure chromatic) существенно ниже, чем при наблюдении изображений, имеющих только яркостный контраст (achromatic), переход к компонентам (Cb) и (Cr) выгоден, так как позволяет при их кодировании использовать меньшее количество отсчетов в блоке и за счет этого получить дополнительное сжатие. Этот переход (перекодирование) осуществляется следующим образом

,

,

.

      Далее матрица, представляющая яркостную  компоненту и имеющая размер отсчетов, разделяется на 4 матрицы размером отсчетов каждая, а две цветностных  матрицы (Cb) и (Cr) путем прореживания по строкам и столбцам преобразуются в две цветностных  матрицы (Cb) и (Cr) размером . При прореживании этих матриц из них исключаются каждая вторая строка и каждый второй столбец. Такое преобразование оказывается допустимым, поскольку, как уже отмечалось выше, наше зрение имеет пониженную остроту при наблюдении чисто хроматических изображений. На этом этапе сжатия, с одной стороны, в сжимаемое изображение вносятся необратимые искажения за счет прореживания, т.е. происходит потеря информации, а с другой - имеет место его сжатие в два раза.  Действительно, до прореживания полное количество отсчетов, которыми был представлен блок изображения, равнялось , в то время как после прореживания только 384.

      Затем каждый из отсчетов шести матриц размером отсчетов подвергается ДКП, квантованию на 4096 уровней и представляется 12-разрядным двоичным кодом. При этом получаются шесть матриц спектральных коэффициентов, 4 из которых представляют собой компоненту (Y), а две представляют компоненты (Cb) и (Cr). Основное сжатие достигается на этапе квантования спектральных коэффициентов благодаря тому, что спектральные коэффициенты с большими индексами, на долю которых приходится малая доля энергии изображения, квантуются на малое число уровней (или усекаются), и, следовательно, на их представление затрачивается мало двоичных единиц кода. На этом этапе также имеет место потеря информации, так как в изображение вносятся необратимые искажения (шум квантования). Процесс квантования заключается в том, что матрица спектральных коэффициентов целочисленно поэлементно делится на матрицу квантования, имеющую такую же размерность, что и блоки спектральных коэффициентов, т.е. . При этом значение проквантованного спектрального коэффициента определяется следующим образом

,

где исходное, не квантованное, значение спектрального коэффициента, а соответствующий ему по положению в матрице элемент матрицы квантования. Матрица квантования построена по зональному принципу, составляющие ее числа представляют собой величины равные , где m - число уровней, на которое квантуется спектральный коэффициент, входящий в соответствующую зону. Эта процедура интересна тем, что процесс целочисленного деления с одной стороны обеспечивает приведение спектральных коэффициентов к значениям одного порядка, а с другой стороны благодаря имеющему при этом место округлению достигается собственно квантование. После выполнения операции квантования мы получаем матрицу проквантованных спектральных коэффициентов , особенностью, которой является наличие большого количества малых и нулевых спектральных коэффициентов, расположенных преимущественно в правом нижнем углу матрицы. При восстановлении сжатого изображения значения проквантованных спектральных коэффициентов умножаются поэлементно на значения соответствующих коэффициентов матрицы квантования .

      Следующий шаг алгоритма сжатия состоит  в преобразовании полученной матрицы  квантованных спектральных коэффициентов  в вектор из 64 элементов, в котором малые и нулевые спектральные коэффициенты должны быть по возможности сгруппированы. Эта цель достигается путем применения так называемого зигзаг-сканирования, показанного на рис. 4.1. Поскольку в начале  

      Рис. 4.1. 

зигзаг-сканирования считываются спектральные коэффициенты с большими амплитудами, а в конце - спектральные коэффициенты, величина которых мала или равна нулю, получающаяся в результате этого сканирования последовательность чисел будет в конце содержать длинные последовательности нулей. Эта особенность используется для дальнейшего сжатия данных путем энтропийного кодирования, которое состоит в последовательном применении метода кодирования длин серий и кода Хаффмена. Из ряда спектральных коэффициентов образуются пары чисел, одно из которых равно значению ненулевого спектрального коэффициента, а другое - количеству предшествующих этому спектральному коэффициенту нулей. Полученные таким образом пары сжимаются посредством применения кода Хаффмена с фиксированной таблицей. В этой таблице наиболее вероятным значениям полученных чисел, которые соответствуют малым последовательностям нулей и малым значениям ненулевых спектральных коэффициентов ставятся в соответствие короткие коды. Поскольку код Хаффмена является префиксным, то в данном случае не требуется разделителей между кодовыми словами.

      Алгоритм  декодирования повторяет все  перечисленные операции, но в обратном порядке.

      Достоинством  описанного метода является высокий  коэффициент сжатия, который для  цветных изображений при хорошем  качестве их восстановления может достигать 6 – 10. Величина коэффициента сжатия изображений при их записи в файл может регулироваться посредством специальной опции, которая  соответствующим образом изменяет коэффициенты матрицы квантования . С помощью этой регулировки устанавливается допустимая степень ухудшения сжимаемого изображения, как, например, это сделано в графическом редакторе PhotoShop. Чем большая степень сжатия выбрана, тем большие искажения будут в восстановленном изображении. При недопустимо больших степенях сжатия если не принято специальных мер на восстановленном изображении будет просматриваться блочная структура, так называемый эффект забора, заклеенного объявлениями. В настоящее время этот метод сжатия широко применяется практически во всех графических редакторах. 
 
 
 
 
 
 
 

Информация о работе Мультимедийные технологии