Подходы к измерению информации

Автор работы: Пользователь скрыл имя, 08 Декабря 2011 в 15:27, контрольная работа

Описание работы

Понятие информации (informatio - разъяснение, осведомление, изложение) является одним из основных, ключевых понятий не только в информатике, но и в математике, в физике и др. Понятие “информация” - плохо формализуемое и структурируемое понятие. В силу его всеобщности, объёмности, расплывчатости оно часто понимается неточно и неполно не только обучаемыми. Как правило, это понятие в курсе информатики не определяется, принимается как исходное базовое понятие, неопределяемый терм.

Содержание работы

Введение
Подходы к измерению информации
Содержательный подход
Алфавитный подход

Первичные единицы

Единицы, производные от бита

Заключение

Файлы: 1 файл

информатика.doc

— 69.50 Кб (Скачать файл)

      Содержание 
 

      Введение 

    1. Подходы к измерению информации
      • Содержательный подход
      • Алфавитный подход
 
    1. Первичные единицы
 
    1. Единицы, производные от бита
 

      Заключение 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

      Введение 

      Понятие информации (informatio - разъяснение, осведомление, изложение) является одним из основных, ключевых понятий не только в информатике, но и в математике, в физике и др. Понятие “информация” - плохо формализуемое и структурируемое понятие. В силу его всеобщности, объёмности, расплывчатости оно часто понимается неточно и неполно не только обучаемыми. Как правило, это понятие в курсе информатики не определяется, принимается как исходное базовое понятие, неопределяемый терм.

      Мы  живем в материальном мире. Все, что  нас окружает, и с чем мы сталкиваемся ежедневно, относится либо к физическим телам, либо к физическим полям. Из курса физики мы знаем, что состояния абсолютного покоя не существует, и физические объекты находятся в состоянии непрерывного движении и изменения, которое сопровождается обменом энергией и ее переходом из одной формы в другую. Все виды энергообмена сопровождаются появлением сигналов, то есть все сигналы имеют в своей основе материальную энергетическую природу. При взаимодействии сигналов с физическими телами в последних возникают определенные изменения свойств — это явление называется регистрацией сигналов. Такие изменения можно наблюдать, измерять или фиксировать иными способами — при этом возникают и регистрируются новые сигналы, то есть образуются данные.

      В настоящее время не существует единого  определения термина информация. С точки зрения различных областей знания, данное понятие описывается своим специфическим набором признаков. 
 
 
 

      Подходы к измерению информации 

      Как измерить информацию? Часто мы говорим, что, прочитав статью в журнале или  просмотрев новости, не получили никакой информации, или наоборот, краткое сообщение может оказаться для нас информативным. В то же время для другого человека та же самая статья может оказаться чрезвычайно информативной, а сообщение — нет. Информативными сообщения являются тогда, когда они новы, понятны, своевременны, полезны. Но то, что для одного понятно, для другого — нет. То, что для одного полезно, ново, для другого — нет. В этом проблема определения и измерения информации.

      При всем многообразии подходов к определению понятия информации, с позиции измерения информации нас будут интересовать два из них: определение К. Шеннона, применяемое в математической теории информации (содержательный подход), и определение А. Н. Колмогорова, применяемое в отраслях информатики, связанных с использованием компьютеров (алфавитный подход).  

      Содержательный  подход 

      Согласно  Шеннону, информативность сообщения  характеризуется содержащейся в  нем полезной информацией — той  частью сообщения, которая снимает  полностью или уменьшает неопределенность какой-либо ситуации.

      По  Шеннону, информация — уменьшение неопределенности наших знаний.

      Неопределенность  некоторого события — это количество возможных исходов данного события.

      Так, например, если из колоды карт наугад выбирают карту, то неопределенность равна количеству карт в колоде. При бросании монеты неопределенность равна 2.

      Содержательный  подход часто называют субъективным, так как разные люди (субъекты) информацию об одном и том же предмете оценивают  по-разному.

      Но  если число исходов не зависит от суждений людей (случай бросания кубика или монеты), то информация о наступлении одного из возможных исходов является объективной.

      Если  сообщение уменьшило неопределенность знаний ровно в два раза, то говорят, что сообщение несет 1 бит информации.

      1 бит — объем информации такого сообщения, которое уменьшает неопределенность знания в два раза. 

      Алфавитный  подход 

      Алфавитный  подход основан на том, что всякое сообщение можно закодировать с  помощью конечной последовательности символов некоторого алфавита.

      Алфавит — упорядоченный набор символов, используемый для кодирования сообщений  на некотором языке.

      Мощность  алфавита — количество символов алфавита.

      Двоичный  алфавит содержит 2 символа, его мощность равна двум.

      Сообщения, записанные с помощью символов ASCII, используют алфавит из 256 символов. Сообщения, записанные по системе UNICODE, используют алфавит из 65 536 символов.

      С позиций computer science носителями информации являются любые последовательности символов, которые хранятся, передаются и обрабатываются с помощью компьютера. Согласно Колмогорову, информативность последовательности символов не зависит от содержания сообщения, алфавитный подход является объективным, т.е. он не зависит от субъекта, воспринимающего сообщение. 

      Информация  трактуется по разному, например, как:

    • любая сущность, которая вызывает изменения в некоторой информационно-логической модели системы (математика, системный анализ);
    • сообщения, полученные системой от внешнего мира в процессе адаптивного управления, приспособления (теория управления, кибернетика);
    • отрицание энтропии, отражение меры хаоса в системе (термодинамика);
    • связи, устраняющие неопределённость в системе (теория информации);
    • вероятность выбора в системе (теория вероятностей);
    • отражение разнообразия в системе (физиология, биокибернетика);
    • отражение материи, атрибут сознания, “интеллекта” системы (философия).

      Если  отвлечься от конкретного смыслового содержания информации и рассматривать  сообщения информации как последовательности знаков, сигналов, то их можно представлять битами, а измерять в байтах, килобайтах, мегабайтах, гигабайтах, терабайтах и петабайтах. 

      Первичные единицы

       

      Сравнение разных единиц измерения информации. Дискретные величины представлены прямоугольниками, единица «нат» — горизонтальным уровнем. Риски слева — логарифмы натуральных чисел. 
 

      Объёмы  информации можно представлять как  логарифм количества состояний.

      Наименьшее  целое число, логарифм которого положителен  — 2. Соответствующая ему единица  — бит — является основой исчисления информации в цифровой технике.

      Единица, соответствующая числу 3 (трит) равна  бита, числу 10 (хартли) —  бита.

      Такая единица как нат (nat), соответствующая  натуральному логарифму применяется  в вычислительной технике в инженерных и научных расчётах. Основание  натуральных логарифмов не является целым числом. 

      Единицы, производные от бита 

      Целые количества бит отвечают количеству состояний, равному степеням двойки.

      Особое  название имеет 4 бита — ниббл (полубайт, тетрада, четыре двоичных разряда), которые  вмещают в себя количество информации, содержащейся в одной шестнадцатеричной цифре.

      Что такое «байт»?

      Байт (англ. byte) — единица хранения и  обработки цифровой информации. В  настольных вычислительных системах байт считается равным восьми битам, в  этом случае он может принимать одно из 256 (28) различных значений. Следует понимать, что количество бит в байте не является однозначной величиной и может варьироваться в широком диапазоне. Так, в первых компьютерах размер байта был равен 6 битам. В суперкомпьютерах, вследствие используемой адресации, один байт содержит 32 бита. Для того, чтобы подчеркнуть, что имеется в виду восьмибитный байт, а также во избежание широко распространенного заблуждения, что в одном байте исключительно восемь бит, в описании сетевых протоколов используется термин «октет» (лат. octet).

      Название  «байт» (слово byte представляет собой  сокращение словосочетания BinarY TErm —  «двоичный терм») было впервые использовано в 1956 году В. Бухгольцем (англ. Werner Buchholz) при проектировании первого суперкомпьютера IBM 7030 (англ.) для пучка одновременно передаваемых в устройствах ввода-вывода шести битов. Позже, в рамках того же проекта, байт был расширен до восьми бит.

      Октет. Октет в информатике — 8 бит. В русском языке октет обычно называют байтом.

      Слово «октет» часто употребляется  при описании сетевых протоколов, так как они предназначены  для взаимодействия компьютеров, имеющих  не обязательно одинаковую платформу. В отличие от байта, который (в широком смысле) может быть равен 10, 12 и т. п. битам, октет всегда равен 8 битам.

      Дабы  исключить двусмысленность, во французском  языке слово «октет» используется почти везде, где в русском  или английском языках употребляется  слово «байт».

      Такие величины как машинное слово и т. п., составляющие несколько байт, в качестве единиц измерения почти никогда не используются.

      Килоба́йт (кБ, Кбайт, КБ) — единица измерения количества информации, равная в зависимости от контекста 1000 или 1024 (2¹º) стандартным (8-битным) байтам. Применяется для указания объёма памяти в различных электронных устройствах.

      1 килобайт (КБ) = 8 килобит (Кб)

      Название  «килобайт» часто применяется для 1024 байт, но формально неверно, так  как приставка кило-, традиционно  означает умножение на 1000, а не 1024. Согласно предложению МЭК Международной электротехнической комиссии), формально правильной (хотя и относительно редко используемой) для 2¹º является двоичная приставка киби-.

      Исторически сложилось, что со словом «байт» несколько некорректно (вместо 1000 = 10³ принято 1024 = 2¹º) использовали и продолжают использовать приставки СИ: 1 Кбайт = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт и т. д. При этом обозначение Кбайт начинают с прописной буквы в отличие от строчной буквы «к» для обозначения множителя 10³.

      Мегабайт (Мбайт, М, МБ) — единица измерения количества информации, равная, в зависимости от контекста, 1 000 000 или 1 048 576  стандартным (8-битным) байтам. Сокращенное название МБ отличается от Мегабита (Мб) строчной буквой (но на самом деле иногда происходит некоторая путаница в сокращениях). Применяется для указания объёма памяти в различных электронных устройствах.

      Название  «Мегабайт» распространено, но не соответствует  ГОСТ 8.417-2002, где приставка мега- означает умножение на 1 000 000, а не 1 048 576. Сложившимся положением пользуются некоторые корпорации, производящие жёсткие диски, которые при маркировке своих изделий под мегабайтом понимают 1 000 000 байт, а под гигабайтом — 1 000 000 000 байт. Согласно предложению МЭК, для 220 предлагается двоичная приставка меби-.

      Самую оригинальную трактовку термина  «мегабайт» используют производители CD, DVD и компьютерных дискет, которые  понимают под ним 1 024 000 байта. Таким  образом, дискета, на которой указан объём 1,44 Мбайт, на самом деле вмещает лишь 1440 Кбайт, то есть 1,38 Мбайт в обычном понимании.

      В связи с этим получилось, что мегабайт бывает коротким, средним и длинным:

      короткий  — 1 000 000 байт

      средний — 1 024 000 байт

      длинный — 1 048 576 байт

      По  этим, а также по ряду других причин, одинаково маркированные носители информации могут иметь различную емкость в байтах.

      На IT-сленге мегабайт ещё называют: метр и мег. В 90-е годы XX века, когда  мегабайт был ещё достаточно большой  единицей измерения, а основной единицей передачи через Интернет был килобайт, называемый килограммом, мегабайт соответственно назывался тонной.

Информация о работе Подходы к измерению информации