Хэширование

Автор работы: Пользователь скрыл имя, 03 Декабря 2017 в 16:32, реферат

Описание работы

Хэширование — преобразование массива входных данных произвольной длины в (выходную) битовую строку фиксированной длины, выполняемое определённым алгоритмом. Функция, реализующая алгоритм и выполняющая преобразование, называется «хеш-функцией» или «функцией свёртки». Исходные данные называются входным массивом, «ключом» или «сообщением». Результат преобразования (выходные данные) называется «хешем», «хеш-кодом», «хеш-суммой», «сводкой сообщения».

Файлы: 1 файл

blockchain.doc

— 123.50 Кб (Скачать файл)

Проблема двойной траты

Выше я сказал, что транзакции добавляются в специальный «пул неподтвержденных транзакций». Зачем нам какая-то промежуточная сущность, если у нас уже есть по сути готовые подписанные транзакции? Почему не писать их сразу в блокчейн?

Потому что сигналы из пункта А в пункт Б всегда идут с задержкой. Две транзакции могут пойти абсолютно разными путями. И транзакция, которая была инициирована первой, может дойти до получателя позже, потому что шла более длинным путём. Так получается двойное расходование, когда одни и те же деньги были отправлены сразу двум адресатам, о чем они даже не догадаются. Это вам не купюры из рук в руки передавать.

Для децентрализованной сети, в которой никому нельзя доверять, эта проблема стоит особенно остро. Вот как вы убедитесь, что одна транзакция точно была раньше другой? Попросите отправителя вшивать в неё время отправки, не так ли? Но вспомните — никому нельзя доверять, даже отправителю. Время на всех компьютерах обязательно будет отличаться и нет способа их гарантировано синхронизировать. Копия блокчейна хранится на каждом компьютере сети и каждый участник доверяет только ей. 

Как же убедиться, что одна транзакция была раньше другой?

Ответ прост: это невозможно. Нет способа подтвердить время транзакции в децентрализованной сети. И вот в решении этой проблемы и заключается третья важная идея блокчейна, которая прописана прям в его названии — блоки.

Весь блокчейн по сути и есть список таких блоков, где каждый ссылается на предыдущий. По нему можно отследить любую транзакцию за всю историю, разматывая блокчейн хоть до самой первой записи. Именно этот список и весит сейчас сотни гигабайт и должен быть полностью скачан на все компьютеры, которые хотят принимать участие в работе сети (но чтобы просто создавать транзакции и переводить деньги, это не обязательно). Скачивается он так же со всех ближайших компьютеров сети, как будто вы скачиваете сериал, только новые новые серии в нём выходят каждые 10 минут.

Набрав себе транзакций из пула компьютер начинает составлять из них такой же неподделываемый список, как мы в начале поста на доске у себя дома. Только делает он его в виде дерева — хеширует записи попарно, потом результат еще раз попарно и так пока не останется лишь один хеш — корень дерева, который и добавляется в блок. Почему дерево? Потому что появляется возможность удалять ненужные (потраченные) транзакции из блока. Т.е. например есть две транзакции, объединённые хэшом, одна или обе уже не нужны т.к. это уже всё давно отдано другими транзакциями - так вот эти старые можно удалить, а хэш оставить, в итоге ничего не нарушается. 

Так как актуальный блокчейн уже скачан, наш компьютер точно знает какой в нём сейчас последний блок. Ему остается только добавить ссылку на него в заголовок блока, захешировать всё это и сообщить всем остальным компьютерам сети «смотрите, я сделал новый блок, давайте добавим его в наш блокчейн».

Остальные должны проверить, что блок построен по всем правилам и что мы не добавили туда лишних транзакций, а затем добавить к себе в цепочки. Теперь все транзакции в нём подтверждены, блокчейн увеличен на один блок и всё идет хорошо, не так ли? 

А вот и нет. В сети одновременно работают тысячи компьютеров, и как только они соберут новый блок, они почти одновременно ринутся сообщать всем, что их блок был создан первым. А из предыдущего раздела мы уже знаем, что в децентрализованной сети невозможно доказать кто действительно был первым.

Поэтому для включения блока в цепочку компьютеры должны решить какую-то сложную задачку, которая займет у них определенное время.

Как в школе, когда все решали сложную контрольную, очень редко бывало так, что даже отличники сдавали ответы абсолютно одновременно.  
Но если для человека сложная задача — это спланировать отпуск, чтобы и на майские праздники попал, и билеты на море недорого, то для компьютера — это добавить в конец блока такое число (nonce), чтобы в результате хеш SHA-256 для всего блока начинался, скажем, на 10 нулей. Это и есть та задача, которую надо решить, чтобы добавить блок в сеть Bitcoin. Для других сетей задачи могут отличаться.

Так мы приходим к понятию майнинга, в основе которого лежит blockchain.

Майнинг

Все пользователи сети равноправны и, вообще говоря, могут делать все, что угодно, в том числе безуспешно пытаться обмануть других пользователей. Запретить им никто не может, потому что все находятся в равных условиях.

Войдя в blockchain-сеть, пользователь подключается к другим компьютерам сети для того, чтобы обмениваться с ними данными: блоками и записями. Важно, что эта сеть никак не привязана к географии, то есть пользователь из Москвы может одновременно подключиться к пользователям из Пекина, Лондона, Нью-Йорка и Буэнос-Айреса. И это, кстати, также защищает его от любых региональных особенностей.

Получив новые данные, каждый пользователь проверяет их корректность, и, убедившись в достоверности, сохраняет их у себя, а также передает дальше по сети. Таким образом, в сети может курсировать два вида данных – поддельные и настоящие – которые распространяются, соответственно, злоумышленниками и добросовестными. Каждый из добропорядочных участников, обнаружив поддельные данные, дальше их не передает. В итоге поддельные данные блуждают только между злонамеренными участниками, а добропорядочные участники обмениваются только корректными данными.

Участники сети делятся на две группы: обычные пользователи, которые создают новые записи, и майнеры.

Обычные пользователи создают и распространяют по сети записи, например, «человек с ключом А взял в кредит автомобиль с ключом Х». Как вы видите, все записи открыты, но зашифрованы. Если вы знаете ключ автомобиля, то вы можете узнать, находится ли он в кредитном залоге, но не узнаете имя его владельца или наименование банка-залогодержателя, если они сами не решили разместить эти данные в открытом виде.

Майнер – это такой же пользователь blockchain-сети, как и все остальные. Но, кроме проверки и распространения данных, он еще занимается созданием новых блоков.

Пока новая запись не внесена ни в один блок, она не считается достоверной. Любой участник сети может ее использовать только на свой страх и риск, поскольку есть вероятность, что это некорректная или даже поддельная запись. Поэтому обычно участники просто пересылают новые записи, чтобы она рано или поздно дошла до майнера. Получив новые записи от других участников сети, майнер собирает их вместе, формирует заголовок будущего блока и рассчитывает ключ блока. Допустим, после первого расчета ключ получился вот таким. Однако, по правилам, ключ должен начинаться с десяти нулей. Почему именно на 10 нулей? А просто так, в этом нет никакого смысла. Так придумал Сатоши. Потому что это одна из тех задач, на которую точно всегда есть решение, но оно точно не может быть найдено быстрее, чем долгим монотонным перебором вариантов. Чтобы изменился ключ, необходимо изменить исходные данные. Для этого в заголовке блока предусмотрено специальное поле, которое называется nonce. При первом расчете оно равно 0. Поэтому майнер меняет значение на 1 и снова рассчитывает ключ. Теперь он полностью изменился.То есть опять начинается не с нулей. Тогда майнер увеличивает nonce до 2 и перерасчитывает ключ. Чтобы найти подходящее значение ключа, майнерам приходится делать миллиарды и триллионы перерасчетов. И когда подходящий ключ все-таки найден, майнер сохраняет блок и отправляет его другим участникам сети. Теперь все записи в блоке подтверждены и защищены ключом, который весьма нелегко подделать. Причем, как вы помните, в ключе блока закодирован и ключ предыдущего блока, который теперь подделать уже просто нереально.

Сложность майнинга (а именно так называется процесс поиска ключа) напрямую зависит от размера сети, то есть её суммарной мощности. Если вы создадите свой блокчейн и запустите его себя дома на двух ноутбуках, то задача должна быть попроще. Например чтобы хеш начинался только с одного нуля, или чтобы сумма четных разрядов была равна сумме нечетных. 
Чтобы найти начинающийся на 10 нулей хеш, у одного компьютера уйдет несколько десятков лет. Но если объединить тысячи компьютеров в единую сеть и искать параллельно, то по теории вероятностей эта задача решается в среднем за 10 минут. Это и есть время появления нового блока в блокчейне. Каждые 8-12 минут кто-то на земле находит такой хеш и получает привилегию анонсировать свою находку на всех, избежав тем самым проблемы кто был первым.

Хитрость майнинга ключей заключается еще и в том, что этот процесс не имеет прогресса. Проще говоря, неважно, когда вы начали искать ключ, сколько записей входит в блок, сколько времени вы уже считаете, сколько ключей вы уже перебрали – вероятность нахождения ключа на любой итерации всегда одинакова. А это значит, что вы не можете сделать предрасчет, не можете купить ключи, не можете создать склад ключей – все это бессмысленно, а все участники равноправны. И у каждого майнера есть только одна возможность получить подходящий ключ – это считать, считать и считать.

Вот этим и занимаются майнеры. За каждый созданный блок они получают плату. Кто первым нашел ключ, тот создал блок и заработал. Остальные не получили ничего. Затем они все вместе принимаются за поиск ключа для нового блока.

Таким образом, замысловатая процедура расчета ключей, конечно, усложняет создание блока, но еще больше она усложняет создание поддельных блоков, делая это почти невозможным.

Суть майнинга — решить любую вычислительную задачу. Эта задача должна быть достаточно простой, чтобы у участников сети была стабильная вероятность найти ответ — иначе транзакции будут подтверждаться вечность. Представьте, что на кассе в магазине вам надо каждый раз ждать по пол часа, пока банк подтвердит вашу транзакцию.

Никто не будет пользоваться таким банком.  
Но задача должна быть одновременно и сложной, чтобы ответ не нашли сразу все пользователи сети. Потому что в таком случае они анонсируют в сеть много блоков с одинаковыми транзакциями и будет вероятность двойной растраты. Или еще хуже — разделения единого блокчейна на несколько веток, в которых уже никто не сможет разобраться какая транзакция подтверждена, а какая нет.

Представим ситуацию, в которой несмотря на всю нашу теорию вероятностей, два майнера всё равно умудрились одновременно найти правильный ответ. Они начинают рассылать два абсолютно верных блока по сети. Эти блоки гарантировано отличаются, ведь даже если они чудом выбрали одинаковые транзакции из пула, составили абсолютно идентичные деревья и угадали одинаковое рандомное число (nonce), их хеши всё равно будут разными, так как каждый пропишет в блок свой номер кошелька для вознаграждения.

Теперь у нас есть два валидных блока и снова возникает проблема кого считать первым. Как поведет себя сеть в таком случае? 
В алгоритме блокчейна прописано, что участники сети просто принимают первый правильный ответ, который до них дошел. Дальше они живут исходя из собственной картины мира. Оба майнера получат своё вознаграждение, а все остальные начинают майнить, опираясь на последний ими лично полученный блок, отбрасывая все остальные повторно-верные. В сети появляется две версии правильного блокчейна. Такой вот парадокс.

Это штатная ситуация, в которой снова помогает теория вероятностей. Сеть функционирует в таком вот раздвоенном состоянии, пока кто-то из майнеров не находит следующий блок к одной из этих цепочек. Как только такой блок находится и вставляется в цепочку, она становится длиннее и включается одно из соглашений сети блокчейн:при любых условиях, самая длинная цепочка блоков принимается как единственно верная для всейсети. Короткая цепочка, несмотря на всю свою правильность, отвергается всеми участникам сети. У майнера пропадает его вознаграждение, потому что его блока больше не существует. 

С ростом сети такие совпадения из «очень маловероятных» переходят в разряд «ну иногда бывает». Старожилы рассказывают, что бывали случаи, когда отбрасывалась цепочка сразу из четырех блоков.

Из-за этого были придуманы три правила безопасности хвоста блокчейна:

  1. Вознаграждениями за майнинг, можно пользоваться только спустя еще 20 подтвержденных блоков после получения. Для биткоина это около трёх часов.
  2. Если вам переслали биткоины, использовать их в качестве инпутов в новых транзакциях можно только спустя 1-5 блоков. 
  3. Правила 1 и 2 всего лишь прописаны в настройках каждого клиента. Никто не следит за их соблюдением. Но закон о самой длинной цепочке всё равно уничтожит все ваши транзакции, если вы попытаетесь обмануть систему, не соблюдая их.

Пытаемся обмануть блокчейн

Теперь, когда вы знаете всё о майнинге, устройстве блокчейна и правиле самой длинной цепочки, у вас мог возникнуть вопрос: а можно ли как-то специально обогнать блокчейн, составив самую длинную цепочку самому, тем самым подтвердив свои фейковые транзакции.

Предположим у вас есть самый мощный компьютер на Земле. Датацентры Google и Amazon вместе взятые в вашем распоряжении и вы пытаетесь просчитать такую цепочку, которая станет самой длинной в сети блокчейн.

Вы не можете взять и сразу просчитать несколько блоков цепочки, ведь каждый следующий блок зависит от предыдущего. Тогда вы решаете как можно быстрее считать каждый блок на своих огромных датацентрах параллельно с тем, как все остальные участники продолжают увеличивать основной блокчейн. Возможно ли их обогнать? Вероятно, да.

Если ваша вычислительная мощность будет составлять больше 50% от мощности всех участников сети, то с вероятностью 50% вы сможете построить более длинную цепочку быстрее всех остальных вместе взятых. Это теоретически возможный способ обмануть блокчейн, просчитав более длинную цепочку транзакций. Но в реальности ни один датацентр не сравнится по мощности со всеми компьютерами в мире. Это примерно как выйти на улицу и пытаться убедить каждого человека в мире, что доллар теперь стоит 1 рубль и успеть до того, как в СМИ вас разоблачат. И вот если вы умудритесь убедить всех, то сможете обвалить мировую экономику. В теории ведь это возможно? Но на практике почему-то ни у кого не получалось.

Информация о работе Хэширование