Кодирование и хранение символьной информации символов и строк. Кодировка символов ASCII

Автор работы: Пользователь скрыл имя, 10 Февраля 2012 в 19:53, курсовая работа

Описание работы

Объект исследования - символьная и строковая информация.
Предмет - кодирование и хранение символьной информации символов и строк. Кодировка символов ASCII.
Цель – проанализировать кодирование, хранение символьной информации символов и строк и кодировку символов ASCII в учебной литературе по информатике.

Содержание работы

Введение…………………………………………………………………………...3
Глава 1. Информация……………………………………………………………..6
Понятие информации и данных………………………………………...6
Виды и свойства информации…………………………………………11
Информационные процессы…………………………………………...15
Информационные технологии…………………………………………17
Информационные системы…………………………………………….21
Обработка информации. Алгоритмы.…………………………...…….25
Глава 2. Кодирование и хранение символьной информации……………...…31
2.1. Кодирование информации………………………………………………..31
2.2. Классификация кодов……………………………………………………..32
2.3. Кодирование символьной информации…….……………………………34
2.4. Способы представления символьных данных в ЭВМ………………….41
2.5. Кодирование текстовой информации……………………………………43
2.6. Хранение символьной информации……………………………………..46
Заключение……………………………………………………………………….49
Глоссарий………………………………………………………………………...50
Список используемой литературы……………………………………………...54

Файлы: 1 файл

Курсовая работа по предмету Архитектура компьютера на тему Кодирование и хранение символьной информации символов и строк. Кодировка символов ASCII.docx

— 149.42 Кб (Скачать файл)

    Такое количество символов достаточно  вполне для представления текстовой  информации, включая прописные и  строчные буквы русского и  латинского алфавита, цифры, знаки,  графические символы и пр.

    Кодирование заключается в том,  что каждому символу ставится  в соответствии уникальный десятичный  код от 0 до 255 или соответствующий  ему двоичный код от 00000000 до 11111111. Таким образом, человек различает  символы по их начертаниям,  а компьютер – по их кодам.

    При вводе в компьютер текстовой  информации происходит её двоичное  кодирование, изображение символа  преобразуется в его двоичный  код. Пользователь нажимает на  клавиатуре клавишу с символом, и в компьютер поступает определённая  последовательность из восьми  электрических импульсов (двоичный  код символа). Код символа хранится  в оперативной памяти компьютера, где занимает один байт.

    В процессе вывода символа на экран компьютера производится обратный процесс – декодирование, то есть преобразование кода символа в его изображение.

   Присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется  в кодовой таблице. Первые с 33 кода (с 0 по 32) соответствуют  не символам, а операциям (перевод строки, ввод пробела и так далее).

    Коды с 33 по 127 являются интернациональными  и соответствуют символам латинского  алфавита, цифрам, знакам арифметических операций и знакам препинания.

    Коды с 128 по 255 являются национальными,  то есть  в национальных кодировках  одному и тому же коду соответствуют  различные символы. К сожалению,  в настоящее время существуют  пять различных кодовых таблиц  для русских букв (КОИ-8, СР1251, СР866, Мас, ISO – рисунок 10), поэтому тексты, созданные в одной кодировке, не будет правильно отображаться в другой.

Двоичный  код Десятичный  код КОИ-8 СР1251 СР866 Mac ISO
00000000 0  
…………    
00001000 8 Удаление  последнего символа (клавиша Backspace)
…………    
00001101 13 Перевод строки (клавиша Enter)
…………    
00100000 32 Пробел
00100001 33 !
…………    
01011010 90 Z
………….    
01111111 127
10000000 128 - Ъ А А к
…………            
11000010 194 б В - - Т
11001100 204 л М | | Ь
…………            
11011101 221 щ Э _ Ë н
…………            
11111111 255 ь я Нераздел.

пробел

Нераздел.

пробел

п
 

Рисунок 10: Кодировки символов

    В настоящее время широкое  распространение получил новый  международный стандарт UNICODE, который отводит на каждый символ не один байт, а два, поэтому с его помощью можно закодировать не 256 символов, а N = 216 = 65536 различных символов. Эту кодировку поддерживают последние версии платформы Microsoft Windows&Office (начиная с 1997 года).

    Каждая кодировка задаётся своей собственной кодовой таблицей. Как видно из рисунка 10, одному и тому же двоичному коду в различных кодировках поставлены в соответствие различные символы.

Например, последовательность числовых кодов 221, 194, 204 в кодировке СР1251 образует слово  «ЭВМ», тогда как в других кодировках это будет бессмысленный набор  символов.

    В большинстве случаев пользователь  не должен заботиться о перекодировках  текстовых документов, так как  это делают специальные программы-конверторы, встроенные в приложения.

 

2.6. Хранение  символьной  информации

    Информация, закодированная с помощью естественных и формальных языков, а также информация в форме зрительных и звуковых образов хранится в памяти человека. Однако для долговременного хранения информации, её накопления и передачи из поколения в поколение используются носители информации.

    Материальная природа носителей  информации может быть различной:  молекулы ДНК, которые хранят  генетическую информацию, бумага, на  которой хранятся тексты и  изображения, магнитная лента,  на которой хранится  звуковая  информация, фотоплёнки и киноплёнка, на которых хранится графическая информация, микросхем памяти, магнитные и лазерные диски, на которых хранятся программы и данные в компьютере, и так далее.

    По оценкам специалистов, объём  информации, фиксируемой на различных  носителях, превышает один эксабайт  в год (1018 байт/год). Примерно 80 % всей  этой информации хранится в цифровой форме на магнитных и оптических носителях и только 20 % - на аналоговых носителях (бумага, магнитные ленты, фотоплёнки и киноплёнки). Если всю записанную в 2000 году информацию распределить на всех жителей планеты, то на каждого человека придётся по 250 Мбайт, а для её хранения потребуется 85 миллионов жёстких магнитных дисков по 20 Гбайт.

    Информационная  ёмкость носителей информации. Носители информации характеризуются информационной ёмкостью, то есть количеством информации, которое они могут хранить. Наиболее информационно ёмкими являются молекулы ДНК, которые имеют очень малый размер и плотно упакованы. Это позволяет хранить огромное количество информации (до 1021 битов в 1см3), что даёт возможность организму развиваться на одной - единственной клетки, содержащей всю необходимую генетическую информацию.

    Микросхемы памяти позволяют  хранить в 1 см3 до 1010 битов информации, однако это в 100 миллиардов раз меньше, чем в ДНК. Можно сказать, что современные технологии пока существенно проигрывают биологической революции.

    Однако если сравнивать информационную  ёмкость традиционных носителей,  то прогресс очевиден. На каждом  гибком магнитном диске может  храниться книга объёмом около  600 страниц, а на жёстком магнитном  диске или DVD – целая библиотека, включающая десятки тысяч книг.

    Надёжность и долговременность хранения информации. Большое значение имеет надёжность и долговременность хранения информации. Большую устойчивость к возможным повреждениям имеют молекулы ДНК, так как существует  механизм обнаружения повреждений  их  структуры (мутаций) и самовосстановления.

    Надёжность (устойчивость к повреждениям) достаточно высока у аналоговых  носителей, повреждение которых  приводит к потери информации только на повреждённом участке. Повреждённая часть фотографии не лишает возможности видеть оставшуюся часть, повреждение участка магнитной ленты приводит лишь к временному пропаданию звука и так далее.

    Цифровые носители гораздо более  чувствительны к повреждениям, даже  утеря одного бита данных на  магнитном или оптическом диске  может привести к невозможности  считать файл, то есть к потере  большого объёма данных. Именно поэтому необходимо соблюдать правила эксплуатации и хранения цифровых носителей информации.

    Наиболее долговременным носителем  информации является молекула  ДНК, которая в течение десятков  тысяч лет (человек) и миллионов  лет (некоторые живые организмы), сохраняет генетическую информацию  данного вида.

    Аналоговые носители способны сохранять информацию в течение тысяч лет (египетские папирусы и шумерские глиняные таблички), сотен лет (бумага) и десятков лет (магнитные ленты, фотоплёнки и киноплёнки).

    Цифровые носители появились сравнительно недавно и поэтому об их долговременности можно судить только по оценкам специалистов. По экспертным оценкам, при правильном хранении оптические носители способны хранить информацию сотни лет, а магнитные – десятки лет.

 
 
 
 
 
 
 
 
 
 
 

Заключение

    Информация играет важную роль во всех сферах человеческой деятельности.

   Информация - это сведения, которые должны снять в большей или меньшей степени существующую до их получения неопределенность у получателя, пополнить систему его понимания объекта полезными сведениями. Информация играет важную роль в предоставлении сведений для принятия управленческих решений и является одним из факторов, обеспечивающих снижение издержек производства и повышение его эффективности. К информации предъявляются определенные требования:  краткость, четкость формулировок, своевременность поступления;  удовлетворение потребностей конкретных управляющих; точность и достоверность, правильный отбор первичных сведений, оптимальность систематизации и непрерывность сбора и обработки сведений.

    При передаче, хранении и переработке информации в различных системах широко применяют кодирование, в том числе избыточное, для обнаружения и исправления ошибок, и шифрование в целях исключения несанкционированного доступа.

    Несмотря на значительные успехи в развитии технических средств, до сих пор первичные данные часто фиксируются на бумажный носитель – первичный документ (около 73% информации). При этом участие человека-оператора в процессе ввода существенно снижает эффективность информационной системы.

    Следует также отметить и  другие технологии распространения информации, получившие большую популярность в последнее время. К ним относят  электронную почту, радиотекст и видеоконференцию.

 
 
 

Глоссарий

№ п/п Понятие Определение
1 Энтропия мера неопределенности дискретного источника информации.
2 Информация 

в биологии

поведением  живых организмов.
3 Информация 

в кибернетике

процессами  управления в сложных системах (живых  организмах или технических устройствах).
4 Данные зарегистрированные  сигналы
5 Сбор  данных накопление  информации с целью обеспечения  достаточной полноты для принятия решения.
6 Формализация  данных приведение  данных, поступающих из разных источников, к одинаковой форме, чтобы сделать  их сопоставимыми между собой, то есть повысить их уровень доступности.
7 Фильтрация  данных отсеивание  «лишних» данных, в которых нет  необходимости для принятия решений, при этом должен уменьшаться уровень  «шума», а достоверность и адекватность данных должна возрастать.
8 Сортировка  данных упорядочение  данных по заданному признаку с целью  удобства использования, повышает доступность  информации.
9 Архивация данных организация хранения данных в удобной и лёгкодоступной форме, служит для снижения экономических  затрат по хранению данных и повышает общую надёжность информационного  процесса в целом.
10 Защита  данных комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации  данных.
11 Транспортировка данных приём и передача (доставки и поставки) данных между  удалёнными участниками информационного  процесса, при этом источник данных в информатике принято называть сервером, потребителя – клиентом.
12 Преобразование  данных перевод данных из одной формы в другую или  из одной структуры в другую.
13 Информационный  процесс совокупность  последовательных действий (операций), производимых над информацией (в  виде данных, сведений, фактов, идей, гипотез, теорий и пр.), для получения какого-либо результата (достижения цели).
14 Информационные  технологии класс областей деятельности, относящихся к технологиям  управления и обработкой огромного  потока информации с применением  вычислительной техники.
15 Кодирование процесс замены знаков одного набора знаками другого  набора с сохранением содержания той информации, которая подается с помощью этих знаков.
16 Обработка информации получение одних  информационных объектов из  других  информационных  объектов  путем  выполнения  некоторых  алгоритмов.
17 Средства  обработки информации всевозможные  устройства  и  системы, созданные  человечеством, и в первую очередь, компьютер – универсальная машина для обработки информации.
18 Алгоритм сформулированное  на определенном языке точное предписание, которое задает исполнимый за конечное время процесс, начинающийся с произвольных исходных данных определенной структуры и направленный на получение полностью определенного этими исходными данными результата.
19 Код система соответствия между элементами сообщений и  кодовыми комбинациями.
20 Кодер устройство, осуществляющее кодирование.
21 Декодер устройство, осуществляющее обратную операцию, т.е. преобразование кодовой комбинации в сообщение.
22 Алфавит множество возможных  элементов кода, т.е. элементарных символов (кодовых символов) X = {xi}, где i = 1, 2,..., m.
23 Основание количество  элементов кода
24 Кодовой комбинацией конечная последовательность символов данного алфавита.
25 Объём число различных  кодовых комбинаций

(N = mn)

26 Слово минимальная первичная  единица языка, представляющая собой  специальный набор символов и  служащая для наименования понятий, предметов, действий и т.д.
27 Предложение конструкция, выражающая законченную мысль.
28 Текст высказывание, выходящее за рамки предложения  и представляющее собой единое и  целое, наделённое внутренней структурой и организацией в соответствии с  правилами языка.
29 Алфавитом  компьютерной системы совокупность  вводимых и отображаемых символов.
30 Информация сведения, которые  должны снять в большей или  меньшей степени существующую до их получения неопределенность у  получателя, пополнить систему его  понимания объекта полезными  сведениями.
31 Информатика комплексное научное  направление, имеющее междисциплинарный  характер и изучающее общие свойства информации и информационных процессов, а также методы и способы рациональной организации этих процессов с  использованием средств вычислительной техники и связи в различных  сферах человеческой деятельности (социальной, технической, природной).
 
 
 
 
 
 
 
 

Список  используемой литературы

1. В. З. Аладьев и др. «Основы информатики: Учебное пособие». – М.: Информационно-издательский дом «Филин», 2005.

2. Дж. Брукшир «Информатика и вычислительная техника»/Дж. Брукшир. - СПБ.: Питер, 2004.

3. А.И. Громов, М.Я. Сафин «Основы информатики вычислительной техники: Учебное пособие». ВФК – М.: Издательство РУДН, 2004.

4. «Информатика. Базовый курс».: Учебник/ Под ред. С. В. Симоновича. – Спб.: Питер, 2007.

5. А. В. Могилев «Информатика: Учебное пособие для педагогических вузов»/ А.В. Могилев, Н.И. Пак, Е. К. Хеннер: Под ред. Е. К. Хеннера. – М.: Академия, 2001.

6. А. Н. Степанов «Информатика: Учебное пособие для вузов». – СПб.: Питер, 2006.

7. Б. В. Соболь, А. Б. Галин, Ю. В. Панов, Е. В. Рашидова, Н. Н. Садовой «Информатика. Учебник», Ростов-на-Дону «ФЕНИКС», 2007.

8. В. А. Острейковский, И. В. Полякова «Информатика. Теория и практика. Учебное пособие», Москва «ОНИКС», 2008.

9. «Информатика. Учебник»/ Под редакцией доктора технических наук профессора А. Н. Данчула, Москва «Издательство РАГС», 2004.

10. Макарова «Информатика. Учебник для ВУЗов»,  Москва, Дрофа 2000.

Информация о работе Кодирование и хранение символьной информации символов и строк. Кодировка символов ASCII