Аудио- , видеокодеки

Автор работы: Пользователь скрыл имя, 16 Мая 2012 в 20:52, реферат

Описание работы

Что может быть проще, чем вставить диск в привод компьютера или плеера и нажать на кнопку воспроизведения? Но чтобы эти простые действия привели к включению фильма или музыки, должен быть реализован весьма непростой процесс чтения и преобразования медиаданных. Как и людям, разговаривающим на разных языках, медиаданным, записанным в разных форматах, также приходится взаимодействовать с программами-плеерами при посредстве «переводчиков» – кодеков. Без использования кодеков компьютер не смог бы полностью раскрыть свои возможности, так как эти программные модули предназначены для воспроизведения аудио и видео файлов, которые, как известно, хранятся в файлах самых различных форматов.

Файлы: 1 файл

Аудио.docx

— 26.25 Кб (Скачать файл)

Аудио- , видеокодеки.

Что может быть проще, чем  вставить диск в привод компьютера или плеера и нажать на кнопку воспроизведения? Но чтобы эти простые действия привели к включению фильма или музыки, должен быть реализован весьма непростой процесс чтения и преобразования медиаданных. Как и людям, разговаривающим на разных языках, медиаданным, записанным в разных форматах, также приходится взаимодействовать с программами-плеерами при посредстве «переводчиков» – кодеков. Без использования кодеков компьютер не смог бы полностью раскрыть свои возможности, так как эти программные модули предназначены для воспроизведения аудио и видео файлов, которые, как известно, хранятся в файлах самых различных форматов.

1.Понятие видеокодека.

Кодеки (англ. codec – сокращение от coder/decoder – кодировщик/декодировщик) - это программы, используемые для сжатия и воспроизведения из сжатого состояния аудио- и видеофайлов. Также кодеки предназначены для кодирования поток/сигнала с целью его трансляции, сохранения или шифрования, а также раскодирования для просмотра (воспроизведения или расшифровки). Эффективные кодеки обеспечивают значительную экономию соответствующих ресурсов (например, дискового пространства или трафика).

Таким образом, видеокодек — программа/алгоритм сжатия (то есть уменьшения размера) видеоданных (видеофайла, видеопотока) и восстановления сжатых данных.

2.Принцип работы  кодеков

При воспроизведении видеофайла кодек распаковывает сжатое видео  для трансляции его на экране. Информация упакована в специальный медиаконтейнер и содержит в себе звук и видео. Обычно встречаются контейнеры с расширением AVI, ASF, MOV и т.д. В процессе взаимодействия со сплиттером (о нем мы поговорим дальше) и кодеком происходит процесс распаковки контейнера с последующим преобразованием цифрового сигнала в аналоговый через устройство вывода.

 

Файлы-контейнеры разбиты  на блоки (они именуются как chunks - ломти), каждый из которых состоит из заголовка и самих данных. Заголовок определяет, как следует толковать данные: но не заключает в себе алгоритм их обработки. Предполагается, что алгоритм содержится в самой системе, а заголовок только указывает, какой из алгоритмов надлежит в данной ситуации применять.

Возьмем для примера файл, который содержит одну видеодорожку, две или несколько аудио (дубляж английский и русский), одну или несколько  дорожек с субтитрами, данные о  применяемых форматах сжатия, индекс (раздел с адресами размещения определенных мест в записи) и комплект текстовых  полей.

Процесс распаковки медиаконтейнеров (извлечение потоков видео, аудио и субтитров и их разделения) поддерживает и реализует специальная библиотека Windows - сплиттер. Непременными для Windows являются сплиттеры для распаковки AVI, MPEG1/2 и ASF. Для работы с другими форматами потребуется установка дополнительных сплиттеров. После того как сплиттер приступает к процессу воспроизведения аудио- или видеопотока, к работе подключаются кодеки. Являясь специальной библиотекой, кодек декодирует (разжимает) каждый из разделенных потоков.

3.Видеокодеки.  Особенности сжатия видео при  их помощи.

Слово MPEG является сокращением  от Moving Picture Expert Group - названия экспертной группы ISO, действующая в направлении разработки стандартов кодирования и сжатия видео- и аудио- данных. Часто аббревиатуру MPEG используют для ссылки на стандарты, разработанные этой группой. MPEG состоит из трех частей: Audio, Video, System (объединение и синхронизация двух других).  На сегодняшний день известны следующие:

1. MPEG-1 предназначен для записи синхронизированных видеоизображения (обычно в формате SIF, 288 x 358) и звукового сопровождения на CD-ROM с учетом максимальной скорости считывания около 1.5 Мбит/с. Качественные параметры видеоданных, обработанных MPEG-1, во многом аналогичны обычному VHS-видео, поэтому этот формат применяется в первую очередь там, где неудобно или непрактично использовать стандартные аналоговые видеоносители.

2. MPEG-2 предназначен для обработки видеоизображения соизмеримого по качеству с телевизионным при пропускной способности системы передачи данных в пределах от 3 до 15 Мбит/с, а в профессиональной аппаратуре используют потоки скоростью до 50 Мбит/с. На технологии, основанные на MPEG-2, переходят многие телеканалы, сигнал сжатый в соответствии с этим стандартом транслируется через телевизионные спутники, используется для архивации больших объемов видеоматериала.

3. MPEG-3 предназначался для использования в системах телевидения высокой четкости (high-defenition television, HDTV) со скоростью потока данных 20-40 Мбит/с , но позже стал частью стандарта MPEG-2 и отдельно теперь не упоминается. Кстати, формат MP3, который иногда путают с MPEG-3, предназначен только для сжатия аудиоинформации и полное название MP3 звучит как MPEG-Audio Layer-3.

4. MPEG-4. В отличие от своих предшественников, MPEG-4 не является просто технологией сжатия, хранения и передачи видео или аудио информации. MPEG-4 - это, по сути, принципиально новый способ представления информации: объектно-ориентированное отображение цифровых медиа-данных для трех областей: интерактивного мультимедиа, графических приложений и цифрового телевидения. Если стандарты MPEG-1 и MPEG-2 описывают работу с уже готовыми видеокадрами, то MPEG-4 фактически задает правила организации объектно-ориентированной среды. Он имеет дело не просто с цифровыми потоками и массивами данных, а с медиа-объектами, и его основой является формирование на приемном конце и в реальном масштабе времени итогового изображения и звука из имеющихся в наличии отдельных объектов, основываясь на так называемом "схематическом описании события" (scene description information). Основными шагами при этом являются:

- разделение исходной  картинки на различные элементы - "медиа объекты" (media objects);

- описание структуры и  взаимосвязей этих объектов, позволяющее  затем собрать их в единую  видеозвуковую сцену;

- возможность для конечного  пользователя внесения интерактивных  изменений в сцену.

5. MPEG-7. В октябре 1996 года группа MPEG приступила к разработке формата сжатия MPEG 7, призванным определить универсальные механизмы описания аудио и видео информации. Этот формат получил название Multimedia Content Description Interface. В отличие от предыдущих форматов сжатия семейства MPEG, MPEG 7 описывает информацию, представленную в любой форме (в том числе в аналоговой) и не зависит от среды передачи данных. Как и его предшественники, формат сжатия MPEG 7 генерирует масштабируемую информацию в рамках одного описания.

Формат сжатия MPEG 7 использует многоуровневую структуру описания аудио и видео информации. На высшем уровне прописываются свойства файла, такие как название, имя создателя, дата создания и т.д. На следующем уровне описания формат сжатия MPEG 7 указывает особенности сжимаемой аудио или видео информации – цвет, текстура, тон или скорость. Одной из отличительных особенностей MPEG 7 является его способность к определению типа сжимаемой информации. Если это аудио или видео файл, то он сначала сжимается с помощью алгоритмов MPEG 1, MPEG 2, MPEG 4, а затем описывается при помощи MPEG 7. Такая гибкость в выборе методов сжатия значительно снижает объем информации и ускоряет процесс сжатия. Основное преимущество формата сжатия MPEG 7 над его предшественниками состоит в применении уникальных дескрипторов и схем описания, которые, помимо всего прочего, делают возможным автоматическое выделение информации как по общим, так и по семантическим признакам, связанным с восприятием информации человеком. Процедура занесения в каталог и поиска данных находятся вне сферы рассмотрения этого формата сжатия.

6. MPEG-21. Разработка формата сжатия MPEG 21 - это долговременный проект, который называется "Система мультимедийных средств" (Multimedia Framework). Над разработкой этого формата сжатия эксперты начали работать в июне 2000 г. На первых этапах планировалось провести расширение, унификацию и объединение форматов MPEG 4 и MPEG 7 в единую обобщающую структуру. Подразумевалось, что она будет обеспечивать глубокую поддержку управления правами и платежными системами, а также качеством предоставляемых услуг.

7.Cinepak. Один из старейших кодеков, появившихся на рынке. Первоначально был разработан фирмой SuperMac, впоследствии был переработан другой фирмой Radius. Свою популярность кодек получил благодаря использованию минимальных ресурсов процессора. Максимальный коэффициент компрессии составляет 10:1. Кодек выдает среднее качество видеоизображения из-за чрезмерной пикселеризации (изображение выглядит “шероховатым”). К недостаткам кодека также относится изменение насыщенности цвета в видеоизображении, что влечет за собой определенный визуальный эффект – изображение становится более желтым. Cinepak – наиболее асимметричный кодек. Кодирует видеоизображение в 8- и 24-битном разрешении цвета. Алгоритм сжатия использует векторную квантизацию (vector quantization) и межкадровую разность. Плохо работает с видеоизображением, частота воспроизведения которого превышает 15 кадров в секунду. Кодек хорошо сжимает синтезированное динамическое видеоизображения – 2D и 3D анимацию. В случае черно-белого видеоизображения, кодек представляет возможность произвести сжатие в 8-битном режиме с 256 оттенками серого.

8. Intel Indeo. Один из старейших кодеков, появившихся на рынке. Качество сжатого видеоизображения немного лучше, чем у Cinepak. Однако, кодек более требователен к ресурсам процессора. Indeo 3.1/3.2 представляет собой менее асимметричный кодек – время компрессии и декомпрессии видеоизображения примерно равны. Максимальный коэффициент компрессии составляет 15:1. Кодирует видеоизображение в 24-битном разрешении цвета. Алгоритм сжатия использует векторную квантизацию и межкадровую разность. Кодек наиболее подходит для сжатия изображения с “говорящими головами”. Процесс сжатия видеоизображения на порядок быстрее, чем у Cinepak. Видеоизображение, сжатое при помощи кодека Indeo R3.2, имеет цветовые артефакты – изображение расплывается и получает красно-синий оттенок. 

9. H.261- стандарт сжатия видео. Был принят в 1990 году международной организацией ITU. Первоначально он был разработан для передачи по каналам ISDN, на которых ширина потоков данных кратна 64 килобитам/с. Алгоритм стандарта был предназначен для работы с потоками от 40 килобит/с до 2 Мегабит/с. Стандарт поддерживал CIF и QCIF размеры кадров с размерами кадров 352×288 и 176×144 соответственно (и 4:2:0 прореживанием цветовых компонент до 176×144 и 88×72). Он также был изменён (с поддержкой обратной совместимости) для передачи изображений с разрешением по яркости 704×576 (это расширение было добавлено примерно в 1994 году).

10.H263— стандарт сжатия видео, предназначенный для передачи видео по каналам с довольно низкой пропускной способностью (обычно ниже 128 кбит/с). Применяется в программном обеспечении для видеоконференций. H.263 представляет собой развитие стандарта H.261, и алгоритмов MPEG-1 и MPEG-2. Первая версия была завершена в 1995 году и представляла собой хорошую замену для устаревшего H.261 на каналах с любой пропускной способностью. Дальнейшим развитием проекта является H.263v2 .

11. H.264 — стандарт сжатия видеоданных, принятый Международной организацией по стандартизации (ISO). Также известен как MPEG-4 part 10 и AVC (Advanced Video Coding). По сравнению с MPEG2 (DVD-Video) и MPEG4 ASP (DivX, XviD), сжатие H.264 работает существенно более эффективно, обеспечивая лучшее качество изображения (вплоть до недостижимого для MPEG2 и MPEG4 ASP уровня) и меньший объём файла.Главным недостатком H.264 являются заметно более высокие требования к оборудованию для кодирования и воспроизведения видеофайлов.

12. DivX

Разрабатывается компанией  DivX Networks, Inc. Первой появилась версия кодека 3.11. Из себя она представляет взломанный и немного измененный кодек "MPEG-4 Version 3" от Microsoft. Эта версия не соответствует стандарту Mpeg4. Затем появился кодек DivX 5, уже соответствующий спецификации Mpeg4 часть 2. Наиболее стабильной является версия кодека DivX 5.2.1.

Среди новшеств кодека DivX 5 появились:

Общая компенсация движения. Помогает при увеличении («наезде» камеры) и при панорамировании (повороте камеры), если объект сохраняет свою статичность и меняется лишь в  размере или местоположении на картинке. Включение GMC разумно при кодировании фильмов о природе и подобных.

Информация о работе Аудио- , видеокодеки