Автор работы: Пользователь скрыл имя, 12 Сентября 2010 в 13:40, Не определен
Доклад
Кодирование информации
Код -- это набор условных
обозначений (или сигналов) для записи
(или передачи) некоторых заранее определенных
понятий.
Кодирование информации
- это процесс формирования определенного
представления информации. В более узком
смысле под термином «кодирование» часто понимают переход
от одной формы представления информации
к другой, более удобной для хранения,
передачи или обработки.
Обычно каждый образ
при кодировании (иногда говорят -- шифровке)
представлении отдельным знаком.
Знак - это элемент
конечного множества отличных друг от
друга элементов.
В более узком смысле
под термином "кодирование" часто
понимают переход от одной формы представления
информации к другой, более удобной для
хранения, передачи или обработки.
Компьютер может обрабатывать
только информацию, представленную в числовой
форме. Вся другая информация (например,
звуки, изображения, показания приборов
и т. д.) для обработки на компьютере должна
быть преобразована в числовую форму.
Например, чтобы перевести в числовую
форму музыкальный звук, можно через небольшие
промежутки времени измерять интенсивность
звука на определенных частотах, представляя
результаты каждого измерения в числовой
форме. С помощью программ для компьютера
можно выполнить преобразования полученной
информации, например "наложить"
друг на друга звуки от разных источников.
Аналогичным образом
на компьютере можно обрабатывать текстовую
информацию. При вводе в компьютер каждая
буква кодируется определенным числом,
а при выводе на внешние устройства (экран
или печать) для восприятия человеком
по этим числам строятся изображения букв.
Соответствие между набором букв и числами
называется кодировкой символов.
Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.
Способы кодирования
информации.
Одна и та же информация
может быть представлена (закодирована)
в нескольких формах. C появлением компьютеров
возникла необходимость кодирования всех
видов информации, с которыми имеет дело
и отдельный человек, и человечество в
целом. Но решать задачу кодирования информации
человечество начало задолго до появления
компьютеров. Грандиозные достижения
человечества - письменность и арифметика
- есть не что иное, как система кодирования
речи и числовой информации. Информация
никогда не появляется в чистом виде, она
всегда как-то представлена, как-то закодирована.
Двоичное кодирование
- один из распространенных способов представления
информации. В вычислительных машинах,
в роботах и станках с числовым программным
управлением, как правило, вся информация,
с которой имеет дело устройство, кодируется
в виде слов двоичного алфавита.
Кодирование символьной
(текстовой) информации.
Основная операция,
производимая над отдельными символами
текста - сравнение символов.
При сравнении символов
наиболее важными аспектами являются
уникальность кода для каждого символа
и длина этого кода, а сам выбор принципа
кодирования практически не имеет значения.
Для кодирования текстов
используются различные таблицы перекодировки.
Важно, чтобы при кодировании и декодировании
одного и того же текста использовалась
одна и та же таблица.
Таблица перекодировки
- таблица, содержащая упорядоченный некоторым
образом перечень кодируемых символов,
в соответствии с которой происходит преобразование
символа в его двоичный код и обратно.
Наиболее популярные
таблицы перекодировки: ДКОИ-8, ASCII, CP1251,
Unicode.
Исторически сложилось,
что в качестве длины кода для кодирования
символов было выбрано 8 бит или 1 байт.
Поэтому чаще всего одному символу текста,
хранимому в компьютере, соответствует
один байт памяти.
Различных комбинаций
из 0 и 1 при длине кода 8 бит может быть
28 = 256, поэтому с помощью одной таблицы
перекодировки можно закодировать не
более 256 символов. При длине кода в 2 байта
(16 бит) можно закодировать 65536 символов.
Кодирование числовой
информации.
Сходство в кодировании
числовой и текстовой информации состоит
в следующем: чтобы можно было сравнивать
данные этого типа, у разных чисел (как
и у разных символов) должен быть различный
код. Основное отличие числовых данных
от символьных заключается в том, что над
числами кроме операции сравнения производятся
разнообразные математические операции:
сложение, умножение, извлечение корня,
вычисление логарифма и пр. Правила выполнения
этих операций в математике подробно разработаны
для чисел, представленных в позиционной
системе счисления.
Основной системой
счисления для представления чисел в компьютере
является двоичная позиционная система
счисления.
Кодирование текстовой
информации
В настоящее время,
большая часть пользователей, при помощи
компьютера обрабатывает текстовую информацию,
которая состоит из символов: букв, цифр,
знаков препинания и др. Подсчитаем, сколько
всего символов и какое количество бит
нам нужно.
10 цифр, 12 знаков препинания,
15 знаков арифметических действий, буквы
русского и латинского алфавита, ВСЕГО:
155 символов, что соответствует 8 бит информации.
Единицы измерения
информации.
1 байт = 8 бит
1 Кбайт = 1024 байтам
1 Мбайт = 1024 Кбайтам
1 Гбайт = 1024 Мбайтам
1 Тбайт = 1024 Гбайтам
Суть кодирования заключается
в том, что каждому символу ставят в соответствие
двоичный код от 00000000 до 11111111 или соответствующий
ему десятичный код от 0 до 255.
Необходимо помнить,
что в настоящее время для кодировки русских
букв используют пять различных кодовых
таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем
тексты, закодированные при помощи одной
таблицы не будут правильно отображаться
в другой
Основным отображением
кодирования символов является код ASCII
- American Standard Code for Information Interchange- американский
стандартный код обмена информацией, который
представляет из себя таблицу 16 на 16, где
символы закодированы в шестнадцатеричной
системе счисления.
Кодирование графической
информации.
Важным этапом кодирования
графического изображения является разбиение
его на дискретные элементы (дискретизация).
Основными способами
представления графики для ее хранения
и обработки с помощью компьютера являются
растровые и векторные изображения
Векторное изображение
представляет собой графический объект,
состоящий из элементарных геометрических
фигур (чаще всего отрезков и дуг). Положение
этих элементарных отрезков определяется
координатами точек и величиной радиуса.
Для каждой линии указывается двоичные
коды типа линии (сплошная, пунктирная,
штрихпунктирная), толщины и цвета.
Растровое изображение
представляет собой совокупность точек
(пикселей), полученных в результате дискретизации
изображения в соответствии с матричным
принципом.
Матричный принцип
кодирования графических изображений
заключается в том, что изображение разбивается
на заданное количество строк и столбцов.
Затем каждый элемент полученной сетки
кодируется по выбранному правилу.
Pixel (picture element - элемент
рисунка) - минимальная единица изображения,
цвет и яркость которой можно задать независимо
от остального изображения.
В соответствии с матричным
принципом строятся изображения, выводимые
на принтер, отображаемые на экране дисплея,
получаемые с помощью сканера.
Качество изображения
будет тем выше, чем "плотнее" расположены
пиксели, то есть чем больше разрешающая
способность устройства, и чем точнее
закодирован цвет каждого из них.
Для черно-белого изображения
код цвета каждого пикселя задается одним
битом.
Если рисунок цветной,
то для каждой точки задается двоичный
код ее цвета.
Поскольку и цвета
кодируются в двоичном коде, то если, например,
вы хотите использовать 16-цветный рисунок,
то для кодирования каждого пикселя вам
потребуется 4 бита (16=24), а если есть возможность
использовать 16 бит (2 байта) для кодирования
цвета одного пикселя, то вы можете передать
тогда 216 = 65536 различных цветов. Использование
трех байтов (24 битов) для кодирования
цвета одной точки позволяет отразить
16777216 (или около 17 миллионов) различных
оттенков цвета - так называемый режим
"истинного цвета" (True Color). Заметим,
что это используемые в настоящее время,
но далеко не предельные возможности современных
компьютеров.
Кодирование звуковой
информации.
Из курса физики вам
известно, что звук - это колебания воздуха.
По своей природе звук является непрерывным
сигналом. Если преобразовать звук в электрический
сигнал (например, с помощью микрофона),
мы увидим плавно изменяющееся с течением
времени напряжение.
Для компьютерной обработки
аналоговый сигнал нужно каким-то образом
преобразовать в последовательность двоичных
чисел, а для этого его необходимо дискретизировать
и оцифровать.
Можно поступить следующим образом: измерять амплитуду сигнала через равные промежутки времени и записывать полученные числовые значения в память компьютера.
Список литературы
Информация о работе Кодирование звуковой текстовой и графической информации