Автор работы: Пользователь скрыл имя, 05 Февраля 2011 в 17:27, курс лекций
В работе рассматриваются основные вопросы в виде лекций по предмету "Программное обеспечение".
Если для кодирования яркости каждой из основных составляющих соответствует 256 значений (восемь двоичных разрядов), как принято в полутоновых чёрно-белых изображений, то на кодирования цвета одной точки надо затратить 24 разряда. При этом система кодирования обеспечивает однозначное определение около 17 млн различных цветов, что на самом деле близко к чувствительности человеческого глаза. Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным режимом (True Color).
Каждому из основных цветов можно поставить в соответствие дополнительный цвет, то есть, дополняющий основной цвет до белого. Нетрудно заметить, что для любого из основных цветов дополнительным будет цвет, образованный суммой пары остальных основных цветов. Соответственно дополнительными цветами являются:
Принцип декомпозиции произвольного цвета на составляющие компоненты можно применять не только для основных цветов, но и для дополнительных, то есть любой цвет можно представить в виде суммы голубой, пурпуровой и жёлтой составляющей. Такой метод кодирования цвета принят в полиграфии, но в полиграфии используется ещё и четвёртая краска – чёрная (Black, B). Поэтому данная система кодирования обозначается четырьмя буквами CMYK (чёрный цвет обозначается буквой K потому, что буква B уже занята синим цветом), и для представления цветовой графики в этой системе координат надо иметь 32 двоичных разряда. Такой режим тоже называется полноцветным режимом (True Color).
Если уменьшить количество двоичных разрядов, используемых для кодирования цвета каждой точки, то можно сократить объём данных, но при этом диапазон кодированных цветов заметно сокращается. Кодирование цветной графики 16-разрядными двоичными числами называется режимом High Color.
При кодировании информации о цвете с помощью восьми бит данных можно передать только 256 цветовых оттенков. Такой метод кодирования называется индексным. Смысл названия в том, что поскольку 256 значений совершенно недостаточно, чтобы передать весь диапазон цветов, но достаточно, чтобы передать номер (индекс) цвета в некой справочной таблице называемой палитрой.
Приёмы и методы работы со звуковой информацией в вычислительной техники появились значительно позже. К тому же в отличие от числовых, текстовых и графических данных у звукозаписей не было столь же длительной и проверенной истории кодирования. В итоге методы кодирования звуковой информации далеки от стандартизации. Множество отдельных компаний разработали свои корпоративные стандарты, но если говорить обобщенно, то можно выделить два основных направления.
Метод FM (Frequency Modulation) основан на том, что любой сложный звук можно разбить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет правильную синусоиду, а следовательно, может быть описан числовыми параметрами, то есть кодом. В природе звуковые сигналы имеют непрерывный спектр, то есть являются аналоговыми. Их разложение в гармонические ряды и представление в виде дискретных цифровых сигналов выполняют специальные устройства – аналого-цифровые преобразователи (АЦП). Обратное преобразование для воспроизведения звука, закодированным двоичным кодом, выполняют цифро-аналоговые преобразователи (ЦАП). При таких преобразованиях неизбежны потери информации, связанные с методами кодирования, поэтому качество звукозаписи обычно получается не вполне удовлетворительным, соответствует качеству простейших музыкальных инструментов с окрасом, характерным для электронной музыки. В то же время, данный метод кодирования обеспечивает весьма компактный код, и поэтому нашёл применение ещё в те годы, когда ресурсы и средства вычислительной техники были недостаточны.
Метод таблично-волнового (Wave-Table) синтеза лучше соответствует современному уровню развития техники. Если говорить упрощенно, то можно сказать, что где-то в заранее подготовленных таблицах хранятся образцы звуков для множества различных электромузыкальных инструментов (хотя не только для них). В технике такие образцы называются сэмплами. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые параметры его среды, в которой происходит звучание, а также прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, то качество звука, полученное в результате синтеза, получается очень высоким и приближается к качеству реальных музыкальных инструментов.
Существует множество систем представления данных. С одной из них, принятой в информатике и вычислительной технике, двоичным кодом, мы познакомились выше. Наименьшей единицей такого представления является бит (двоичный разряд). Совокупность двоичных разрядов, выражающих числовые или иные данные, образуют некий битовый рисунок. Практика показывает, что битовым представлением удобнее работать, если этот рисунок имеет регулярную форму. В настоящее время в качестве таких форм используются группы из восьми битов, которые называют байтами.
Десятичное число | Двоичное число | Байт |
1 | 1 | 0000 0001 |
2 | 10 | 0000 0010 |
… | … | … |
255 | 11111111 | 1111 1111 |
Понятие
о байте как о группе взаимосвязанных
битов появились вместе с первыми
образцами электронной
Выше мы видели, что во многих случаях целесообразно использовать не восьмиразрядное кодирование, 16-разрядное, 24-разрядное, 32-разрядное и более. Группа из 16-ти взаимосвязанных бит (двух взаимосвязанных байтов) в информатике называется словом. Соответственно, группа из четырёх взаимосвязанных байтов (32 разряда) называются удвоенным словом, а группа из восьми байтов (64 разряда) – учетверённым словом.
Существует
много систем и единиц измерения
данных. Каждая научная дисциплина
и каждая область человеческой деятельности
может использовать свои, наиболее
удобные и традиционно
Наименьшей единицей измерения является байт. Поскольку одним байтом, как правило, кодируется один символ текстовой информации, то для текстовых документов размер в байтах соответствует лексическому объёму в символах (пока исключение составляет универсальная кодировка UNICODE).
Более крупная единица – килобайт (Кбайт). Условно можно считать 1 Кбайт примерно равен 1000 байт. Условность связана с тем, что для вычислительной техники, работающей с двоичными числами, более удобно представление чисел в виде степени двойки и потому на самом деле 1 Кбайт равен 210 байт (1024 байт).
В килобайтах измеряют сравнительно небольшие объёмы данных. Условно можно считать, что одна страница неформатированного машинного текста составляет около 2 Кбайт.
Более
крупные единицы измерения
Единицы | Значения | Метрический аналог |
1 Кбайт | 1024 байта (210 ) | 1000 (102) |
1 Мбайт | 1024 Кбайт (220 ) | 1000000 (106) |
1 Гбайт | 1024 Мбайт (230 ) | 109 |
1 Тбайт | 1024 Гбайт (240) | 1012 |
1 Пбайт | 1024 Тбайт (250 ) | 1015 |
1 Эбайт | 1024 Пбайт (260 ) | 1018 |
1 Збайт | 1024 Эбайт (270) | 1021 |
1 Йбайт | 1024 Збайт (280) | 1024 |
Особо обратим внимание на то, что при переходе к более крупным единицам «инженерная» погрешность, связанная с округлением, накапливается и становится недопустимой, поэтому на старших единицах измерения округления производятся реже.
При хранении данных решается две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить удобный и быстрый доступ.
Для
обеспечения доступа
Поскольку адресные данные тоже имеют размер и тоже подлежат хранению, хранить данные в виде мелких единиц, таких как байт, неудобно. Их неудобно хранить и в более крупных единицах (килобайт, мегабайт и т.п.), поскольку неполное заполнение одной единицы хранения приводит к неэффективности хранения.
В качестве единицы хранения данных принят объект переменной длины, называемый файлом. Файл – это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла.
Проще всего представить себе файл в виде безразмерного канцелярского досье, в которое можно пожеланию добавлять содержимое или извлекать оттуда. Поскольку в определении файла нет ограничений на размер, можно представить себе файл, имеющий 0 байт (пустой файл), и файл, имеющий любое число байтов.
В определении файл особое внимание уделяется имени. Оно фактически несёт в себе адресные данные, без которых данные, хранящиеся файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адресацией имя файла может хранить и сведения о типе данных, заключённых в нём. Для автоматических средств работы с данными это важно, поскольку по имени файла они могут автоматически определить адекватный метод извлечения информации из файла.