Кодирование и хранение символьной информации символов и строк. Кодировка символов ASCII

Автор работы: Пользователь скрыл имя, 10 Февраля 2012 в 19:53, курсовая работа

Описание работы

Объект исследования - символьная и строковая информация.
Предмет - кодирование и хранение символьной информации символов и строк. Кодировка символов ASCII.
Цель – проанализировать кодирование, хранение символьной информации символов и строк и кодировку символов ASCII в учебной литературе по информатике.

Содержание работы

Введение…………………………………………………………………………...3
Глава 1. Информация……………………………………………………………..6
Понятие информации и данных………………………………………...6
Виды и свойства информации…………………………………………11
Информационные процессы…………………………………………...15
Информационные технологии…………………………………………17
Информационные системы…………………………………………….21
Обработка информации. Алгоритмы.…………………………...…….25
Глава 2. Кодирование и хранение символьной информации……………...…31
2.1. Кодирование информации………………………………………………..31
2.2. Классификация кодов……………………………………………………..32
2.3. Кодирование символьной информации…….……………………………34
2.4. Способы представления символьных данных в ЭВМ………………….41
2.5. Кодирование текстовой информации……………………………………43
2.6. Хранение символьной информации……………………………………..46
Заключение……………………………………………………………………….49
Глоссарий………………………………………………………………………...50
Список используемой литературы……………………………………………...54

Файлы: 1 файл

Курсовая работа по предмету Архитектура компьютера на тему Кодирование и хранение символьной информации символов и строк. Кодировка символов ASCII.docx

— 149.42 Кб (Скачать файл)

3. По способу передачи:

  • последовательные и параллельные;
  • блочные - данные сначала помещаются в буфер, а потом передаются в канал и бинарные непрерывные.

4. По помехоустойчивости:

  • простые (примитивные, полные) - для передачи информации используют все возможные кодовые комбинации (без избыточности);
  • корректирующие (помехозащищенные) - для передачи сообщений используют не все, а только часть (разрешенных) кодовых комбинаций.

5. В зависимости от назначения и применения условно можно выделить следующие типы кодов:

  • Внутренние коды - это коды, используемые внутри устройств. Это машинные коды, а также коды, базирующиеся на использовании позиционных систем счисления (двоичный, десятичный, двоично-десятичный, восьмеричный, шестнадцатеричный и др.). Наиболее распространенным кодом в ЭВМ является двоичный код, который позволяет просто реализовать аппаратно устройства для хранения, обработки и передачи данных в двоичном коде. Он обеспечивает высокую надежность устройств и простоту выполнения операций над данными в двоичном коде. Двоичные данные, объединенные в группы по 4, образуют шестнадцатеричный код, который хорошо согласуется с архитектурой ЭВМ, работающей с данными кратными байту (8 бит).
  • Коды для обмена данными и их передачи по каналам связи. Широкое распространение в ПК получил код ASCII (American Standard Code for Information Interchange). ASCII - это 7-битный код буквенно-цифровых и других символов. Поскольку ЭВМ работают с байтами, то 8-й разряд используется для синхронизации или проверки на четность, или расширения кода. В ЭВМ фирмы IBM используется расширенный двоично-десятичный код для обмена информацией EBCDIC (Extended Binary Coded Decimal Interchange Code).

        В каналах связи широко используется телетайпный код МККТТ (международный консультативный комитет по телефонии и телеграфии) и его модификации (МТК и др.).

        При кодировании информации для передачи по каналам связи, в том числе внутри аппаратным трактам, используются коды, обеспечивающие максимальную скорость передачи информации, за счет ее сжатия и устранения избыточности (например: коды Хаффмана и Шеннона-Фано), и коды обеспечивающие достоверность передачи данных, за счет введения избыточности в передаваемые сообщения (например: групповые коды, Хэмминга, циклические и их разновидности).

  • Коды для специальных применений - это коды, предназначенные для решения специальных задач передачи и обработки данных. Примерами таких кодов является циклический код Грея, который широко используется в АЦП угловых и линейных перемещений. Коды Фибоначчи используются для построения быстродействующих и помехоустойчивых АЦП.
 
 

2.3. Кодирование символьной  информации

    Для передачи информации между  собой люди стали использовать  знаки и символы. Начав с простейших условных жестов, человек создал целый мир знаков, где главным средством общения стал язык (то есть речь и письменность). Слово это минимальная первичная единица языка, представляющая собой специальный набор символов и служащая для наименования понятий, предметов, действий и т.д. Следующим по сложности элементов языка является предложение – конструкция, выражающая законченную мысль. На основе предложений строится текст. Текст – высказывание, выходящее за рамки предложения и представляющее собой единое и целое, наделённое внутренней структурой и организацией в соответствии с правилами языка.

    С появлением вычислительных машин стала задача представления в цифровой форме нечисловых величин, и в первую очередь – символов, слов, предложений и текста.

    Символы. Для представления символов в числовой форме был предложен метод кодирования, получивший в дальнейшем широкое распространение и для других видов представления не числовых данных (звуков, изображений и т.д.). Кодом называется уникальное беззнаковое целое двоичное число, поставленное в соответствии некоторому символу. Под алфавитом  компьютерной системы понимают совокупность вводимых и отображаемых символов. Алфавит компьютерной системы включает в себя арабские цифры, буквы латинского алфавита, знаки препинания, специальные символы и знаки, буквы национального алфавита, символы псевдографики – растры, прямоугольники, одинарные и двойные рамки, стрелки. Первоначально для хранения кода одного символа отвели 1 байт (8 битов), что позволяло закодировать алфавит из 256 различных символов. Система, в которой каждому символу алфавита поставлен в соответствии уникальный код, называется кодовой таблицей. Разные производители средств вычислительной техники создавали для одного и то же алфавита символ свои кодовые таблицы. Это приводило к тому, что символы, набранные с помощью одной таблицы кодов, отображались неверно при использовании другой таблицы. Для решения проблемы многообразие  кодовых таблиц в 1981 году Институт стандартизации США (ANSI – American National Standard Institute) принял стандарт кодовой таблицы, получившей название ASCII (American Standard Code of Information Interchange – стандартный код информационного обмена США). Эту таблицу использовали программные продукты, работающие под управлением операционной системы MS-DOS, разработанной компанией Microsoft по заказу крупной фирмы – производителя персональных компьютеров IBM (International Business Machine). Широкое распространение персональных компьютеров фирмы IBM привело к тому, что стандарт ASCII приобрёл статус международного.

    В таблице содержится 256 символов  и их кодов. Таблица состоит  из двух частей: основной и расширенной. Основная часть (символы с кодами от 0 до 127 включительно) является базовой, она в соответствии с принятым стандартом не может быть изменена. В неё вошли: управляющие символы (им соответствуют коды с 1 по 31), арабские цифры, буквы латинского алфавита, знаки препинания, специальные символы (рисунок 5).

Код   Код   Код   Код   Код   Код  
32 пробел 48 0 64 @ 80 P 96 112 p
33 ! 49 1 65 A 81 Q 97 a 113 q
34 50 2 66 B 82 R 98 b 114 r
35 # 51 3 67 C 83 S 99 c 115 s
36 $ 52 4 68 D 84 T 100 d 116 t
37 % 53 5 69 E 85 U 101 e 117 u
38 & 54 6 70 F 86 V 102 f 118 v
39 55 7 71 G 87 W 103 g 119 w
40 ( 56 8 72 H 88 X 104 h 120 x
41 ) 57 9 73 I 89 Y 105 i 121 y
42 * 58 : 74 J 90 Z 106 j 122 z
43 + 59 ; 75 K 91 [ 107 k 123 {
44 , 60 < 76 L 92 \ 108 l 124 |
45 - 61 = 77 M 93 ] 109 m 125 }
46 . 62 > 78 N 94 ^ 110 n 126 ~
47 / 63 ? 79 O 95 _ 111 o 127  
 

Рисунок 5: Базовая часть таблицы кодов ASCII

    Расширенная часть (символы с  кодами от 128 до 255) отдана национальным алфавитам, символам псевдографики и некоторым специальным символам. В соответствии с утверждёнными стандартами эта часть таблицы изменяется в зависимости от национального алфавита той страны, где она используется, и способа кодирования. Именно поэтому, при наименовании программ, документов и других объектов желательно использовать латинские буквы, содержащиеся в основной, неизменяемой части таблицы, так как русскоязычные имена при несоответствии таблиц кодирования будут неверно отображаться. Например, операционная система Windows поддерживает большое число расширенных таблиц для различных национальных алфавитов. В России наиболее распространённой кодовой таблицей алфавита русского языка является «латиница Windows 1251» (рисунок 6).

 
Код   Код   Код   Код   Код   Код   Код   Код  
128 Ђ 144 ђ 160   176 ° 192 А 208 Р 224 а 240 р
129 Ѓ 145 161 Ў 177 ± 193 Б 209 С 225 б 241 с
130 , 146 162 ў 178 І 194 В 210 Т 226 в 242 т
131 ѓ 147 163 Ј 179 і 195 Г 211 У 227 г 243 у
132 148 164 ¤ 180 ґ 196 Д 212 Ф 228 д 244 ф
133 149 165 Ґ 181 µ 197 Е 213 Х 229 е 245 х
134 150 166 ¦ 182 198 Ж 214 Ц 230 ж 246 ц
135 151 167 § 183 · 199 З 215 Ч 231 з 247 ч
136 152 168 Ё 184 ё 200 И 216 Ш 232 и 248 ш
137 153 169 © 185 201 Й 217 Щ 233 й 249 щ
138 Љ 154 љ 170 Є 186 є 202 К 218 Ъ 234 к 250 ъ
139 155 171 « 187 » 203 Л 219 Ы 235 л 251 ы
140 Њ 156 њ 172 ¬ 188 ј 204 М 220 Ь 236 м 252 ь
141 Ќ 157 ќ 173 ­ 189 Ѕ 205 Н 221 Э 237 н 253 э
142 Ћ 158 ћ 174 ® 190 ѕ 206 О 222 Ю 238 о 254 ю
143 Џ 159 џ 175 Ї 191 ї 207 П 223 Я 239 п 255 я
 

Рисунок 6: Расширенная таблица «латиница Windows 1251»

    На компьютерах, работающих в  операционных системах MS-DOS, могут действовать ещё две кодировки (кодировка ГОСТ и кодировка ГОСТ-альтернативная). Первая из них считалась устаревшей даже в первые годы появления персональной вычислительной техники. Но вторая используется и по сей день (рисунок 7).

Код   Код   Код   Код   Код   Код   Код   Код  
128 А 144 Р 160 а 176 192 208 224 р 240 Ё
129 Б 145 С 161 б 177 193 209 225 с 241 ё
130 В 146 Т 162 в 178 194 210 226 т 242 Є
131 Г 147 У 163 г 179 195 211 227 у 243 є
132 Д 148 Ф 164 д 180 196 212 228 ф 244 Ї
133 Е 149 Х 165 е 181 197 213 229 х 245 ї
134 Ж 150 Ц 166 ж 182 198 214 230 ц 246 Ў
135 З 151 Ч 167 з 183 199 215 231 ч 247 ў
136 И 152 Ш 168 и 184 200 216 232 ш 248 °
137 Й 153 Щ 169 й 185 201 217 233 щ 249
138 К 154 Ъ 170 к 186 202 218 234 ъ 250 ·
139 Л 155 Ы 171 л 187 203 219 235 ы 251
140 М 156 Ь 172 м 188 204 220 236 ь 252
141 Н 157 Э 173 н 189 205 221 237 э 253 ¤
142 О 158 Ю 174 о 190 206 222 238 ю 254
143 П 159 Я 175 п 191 207 223 239 я 255  

Информация о работе Кодирование и хранение символьной информации символов и строк. Кодировка символов ASCII