Автор работы: Пользователь скрыл имя, 10 Февраля 2012 в 19:53, курсовая работа
Объект исследования - символьная и строковая информация.
Предмет - кодирование и хранение символьной информации символов и строк. Кодировка символов ASCII.
Цель – проанализировать кодирование, хранение символьной информации символов и строк и кодировку символов ASCII в учебной литературе по информатике.
Введение…………………………………………………………………………...3
Глава 1. Информация……………………………………………………………..6
Понятие информации и данных………………………………………...6
Виды и свойства информации…………………………………………11
Информационные процессы…………………………………………...15
Информационные технологии…………………………………………17
Информационные системы…………………………………………….21
Обработка информации. Алгоритмы.…………………………...…….25
Глава 2. Кодирование и хранение символьной информации……………...…31
2.1. Кодирование информации………………………………………………..31
2.2. Классификация кодов……………………………………………………..32
2.3. Кодирование символьной информации…….……………………………34
2.4. Способы представления символьных данных в ЭВМ………………….41
2.5. Кодирование текстовой информации……………………………………43
2.6. Хранение символьной информации……………………………………..46
Заключение……………………………………………………………………….49
Глоссарий………………………………………………………………………...50
Список используемой литературы……………………………………………...54
3. По способу передачи:
4. По помехоустойчивости:
5. В зависимости от назначения и применения условно можно выделить следующие типы кодов:
В каналах связи широко используется телетайпный код МККТТ (международный консультативный комитет по телефонии и телеграфии) и его модификации (МТК и др.).
При кодировании информации для передачи по каналам связи, в том числе внутри аппаратным трактам, используются коды, обеспечивающие максимальную скорость передачи информации, за счет ее сжатия и устранения избыточности (например: коды Хаффмана и Шеннона-Фано), и коды обеспечивающие достоверность передачи данных, за счет введения избыточности в передаваемые сообщения (например: групповые коды, Хэмминга, циклические и их разновидности).
2.3. Кодирование символьной информации
Для передачи информации между собой люди стали использовать знаки и символы. Начав с простейших условных жестов, человек создал целый мир знаков, где главным средством общения стал язык (то есть речь и письменность). Слово – это минимальная первичная единица языка, представляющая собой специальный набор символов и служащая для наименования понятий, предметов, действий и т.д. Следующим по сложности элементов языка является предложение – конструкция, выражающая законченную мысль. На основе предложений строится текст. Текст – высказывание, выходящее за рамки предложения и представляющее собой единое и целое, наделённое внутренней структурой и организацией в соответствии с правилами языка.
С появлением вычислительных машин стала задача представления в цифровой форме нечисловых величин, и в первую очередь – символов, слов, предложений и текста.
Символы. Для представления символов в числовой форме был предложен метод кодирования, получивший в дальнейшем широкое распространение и для других видов представления не числовых данных (звуков, изображений и т.д.). Кодом называется уникальное беззнаковое целое двоичное число, поставленное в соответствии некоторому символу. Под алфавитом компьютерной системы понимают совокупность вводимых и отображаемых символов. Алфавит компьютерной системы включает в себя арабские цифры, буквы латинского алфавита, знаки препинания, специальные символы и знаки, буквы национального алфавита, символы псевдографики – растры, прямоугольники, одинарные и двойные рамки, стрелки. Первоначально для хранения кода одного символа отвели 1 байт (8 битов), что позволяло закодировать алфавит из 256 различных символов. Система, в которой каждому символу алфавита поставлен в соответствии уникальный код, называется кодовой таблицей. Разные производители средств вычислительной техники создавали для одного и то же алфавита символ свои кодовые таблицы. Это приводило к тому, что символы, набранные с помощью одной таблицы кодов, отображались неверно при использовании другой таблицы. Для решения проблемы многообразие кодовых таблиц в 1981 году Институт стандартизации США (ANSI – American National Standard Institute) принял стандарт кодовой таблицы, получившей название ASCII (American Standard Code of Information Interchange – стандартный код информационного обмена США). Эту таблицу использовали программные продукты, работающие под управлением операционной системы MS-DOS, разработанной компанией Microsoft по заказу крупной фирмы – производителя персональных компьютеров IBM (International Business Machine). Широкое распространение персональных компьютеров фирмы IBM привело к тому, что стандарт ASCII приобрёл статус международного.
В таблице содержится 256 символов и их кодов. Таблица состоит из двух частей: основной и расширенной. Основная часть (символы с кодами от 0 до 127 включительно) является базовой, она в соответствии с принятым стандартом не может быть изменена. В неё вошли: управляющие символы (им соответствуют коды с 1 по 31), арабские цифры, буквы латинского алфавита, знаки препинания, специальные символы (рисунок 5).
Код | Код | Код | Код | Код | Код | ||||||
32 | пробел | 48 | 0 | 64 | @ | 80 | P | 96 | ‘ | 112 | p |
33 | ! | 49 | 1 | 65 | A | 81 | Q | 97 | a | 113 | q |
34 | “ | 50 | 2 | 66 | B | 82 | R | 98 | b | 114 | r |
35 | # | 51 | 3 | 67 | C | 83 | S | 99 | c | 115 | s |
36 | $ | 52 | 4 | 68 | D | 84 | T | 100 | d | 116 | t |
37 | % | 53 | 5 | 69 | E | 85 | U | 101 | e | 117 | u |
38 | & | 54 | 6 | 70 | F | 86 | V | 102 | f | 118 | v |
39 | ′ | 55 | 7 | 71 | G | 87 | W | 103 | g | 119 | w |
40 | ( | 56 | 8 | 72 | H | 88 | X | 104 | h | 120 | x |
41 | ) | 57 | 9 | 73 | I | 89 | Y | 105 | i | 121 | y |
42 | * | 58 | : | 74 | J | 90 | Z | 106 | j | 122 | z |
43 | + | 59 | ; | 75 | K | 91 | [ | 107 | k | 123 | { |
44 | , | 60 | < | 76 | L | 92 | \ | 108 | l | 124 | | |
45 | - | 61 | = | 77 | M | 93 | ] | 109 | m | 125 | } |
46 | . | 62 | > | 78 | N | 94 | ^ | 110 | n | 126 | ~ |
47 | / | 63 | ? | 79 | O | 95 | _ | 111 | o | 127 |
Рисунок 5: Базовая часть таблицы кодов ASCII
Расширенная часть (символы с кодами от 128 до 255) отдана национальным алфавитам, символам псевдографики и некоторым специальным символам. В соответствии с утверждёнными стандартами эта часть таблицы изменяется в зависимости от национального алфавита той страны, где она используется, и способа кодирования. Именно поэтому, при наименовании программ, документов и других объектов желательно использовать латинские буквы, содержащиеся в основной, неизменяемой части таблицы, так как русскоязычные имена при несоответствии таблиц кодирования будут неверно отображаться. Например, операционная система Windows поддерживает большое число расширенных таблиц для различных национальных алфавитов. В России наиболее распространённой кодовой таблицей алфавита русского языка является «латиница Windows 1251» (рисунок 6).
Код | Код | Код | Код | Код | Код | Код | Код | ||||||||
128 | Ђ | 144 | ђ | 160 | 176 | ° | 192 | А | 208 | Р | 224 | а | 240 | р | |
129 | Ѓ | 145 | ‘ | 161 | Ў | 177 | ± | 193 | Б | 209 | С | 225 | б | 241 | с |
130 | , | 146 | ’ | 162 | ў | 178 | І | 194 | В | 210 | Т | 226 | в | 242 | т |
131 | ѓ | 147 | “ | 163 | Ј | 179 | і | 195 | Г | 211 | У | 227 | г | 243 | у |
132 | „ | 148 | ” | 164 | ¤ | 180 | ґ | 196 | Д | 212 | Ф | 228 | д | 244 | ф |
133 | … | 149 | • | 165 | Ґ | 181 | µ | 197 | Е | 213 | Х | 229 | е | 245 | х |
134 | † | 150 | – | 166 | ¦ | 182 | ¶ | 198 | Ж | 214 | Ц | 230 | ж | 246 | ц |
135 | ‡ | 151 | — | 167 | § | 183 | · | 199 | З | 215 | Ч | 231 | з | 247 | ч |
136 | € | 152 | € | 168 | Ё | 184 | ё | 200 | И | 216 | Ш | 232 | и | 248 | ш |
137 | ‰ | 153 | ™ | 169 | © | 185 | № | 201 | Й | 217 | Щ | 233 | й | 249 | щ |
138 | Љ | 154 | љ | 170 | Є | 186 | є | 202 | К | 218 | Ъ | 234 | к | 250 | ъ |
139 | ‹ | 155 | › | 171 | « | 187 | » | 203 | Л | 219 | Ы | 235 | л | 251 | ы |
140 | Њ | 156 | њ | 172 | ¬ | 188 | ј | 204 | М | 220 | Ь | 236 | м | 252 | ь |
141 | Ќ | 157 | ќ | 173 | | 189 | Ѕ | 205 | Н | 221 | Э | 237 | н | 253 | э |
142 | Ћ | 158 | ћ | 174 | ® | 190 | ѕ | 206 | О | 222 | Ю | 238 | о | 254 | ю |
143 | Џ | 159 | џ | 175 | Ї | 191 | ї | 207 | П | 223 | Я | 239 | п | 255 | я |
Рисунок 6: Расширенная таблица «латиница Windows 1251»
На компьютерах, работающих в операционных системах MS-DOS, могут действовать ещё две кодировки (кодировка ГОСТ и кодировка ГОСТ-альтернативная). Первая из них считалась устаревшей даже в первые годы появления персональной вычислительной техники. Но вторая используется и по сей день (рисунок 7).
Код | Код | Код | Код | Код | Код | Код | Код | ||||||||
128 | А | 144 | Р | 160 | а | 176 | ░ | 192 | └ | 208 | ╨ | 224 | р | 240 | Ё |
129 | Б | 145 | С | 161 | б | 177 | ▒ | 193 | ┌ | 209 | ╤ | 225 | с | 241 | ё |
130 | В | 146 | Т | 162 | в | 178 | ▓ | 194 | ┬ | 210 | ╥ | 226 | т | 242 | Є |
131 | Г | 147 | У | 163 | г | 179 | │ | 195 | ├ | 211 | ╙ | 227 | у | 243 | є |
132 | Д | 148 | Ф | 164 | д | 180 | ┤ | 196 | ─ | 212 | ╘ | 228 | ф | 244 | Ї |
133 | Е | 149 | Х | 165 | е | 181 | ╡ | 197 | ┼ | 213 | ╒ | 229 | х | 245 | ї |
134 | Ж | 150 | Ц | 166 | ж | 182 | ╢ | 198 | ╞ | 214 | ╓ | 230 | ц | 246 | Ў |
135 | З | 151 | Ч | 167 | з | 183 | ╖ | 199 | ╟ | 215 | ╫ | 231 | ч | 247 | ў |
136 | И | 152 | Ш | 168 | и | 184 | ╕ | 200 | ╚ | 216 | ╪ | 232 | ш | 248 | ° |
137 | Й | 153 | Щ | 169 | й | 185 | ╣ | 201 | ╔ | 217 | ┘ | 233 | щ | 249 | ∙ |
138 | К | 154 | Ъ | 170 | к | 186 | ║ | 202 | ╩ | 218 | ┌ | 234 | ъ | 250 | · |
139 | Л | 155 | Ы | 171 | л | 187 | ╗ | 203 | ╦ | 219 | █ | 235 | ы | 251 | √ |
140 | М | 156 | Ь | 172 | м | 188 | ╝ | 204 | ╠ | 220 | ▄ | 236 | ь | 252 | № |
141 | Н | 157 | Э | 173 | н | 189 | ╜ | 205 | ═ | 221 | ▌ | 237 | э | 253 | ¤ |
142 | О | 158 | Ю | 174 | о | 190 | ╛ | 206 | ╬ | 222 | ▐ | 238 | ю | 254 | ■ |
143 | П | 159 | Я | 175 | п | 191 | ┐ | 207 | ╧ | 223 | ▀ | 239 | я | 255 |