Хеширование, кодирование и шифрование: сходство и различия
Рядовой пользователь ПК сталкивается с шифрованием, кодированием и хешированием буквально каждый день – и чаще всего даже не подозревает об этом. Более продвинутые пользователи, которые поверхностно знакомы с этими терминами, зачастую их путают.
Хеширование, кодирование и шифрование — определение терминов
У понятий хеширования, кодирования и шифрования действительно есть нечто общее. Все они являются способами преобразования информации. Только делают они это разными способами и с разной целью.
Хеширование
Термин происходит от английского слова hash – «фарш», «месиво». Примерно так хеш-функция и работает: массив данных (например, фрагмент текста) преобразуется в уникальную строку (хеш-сумму), по которой невозможно восстановить исходную информацию.
Cуществуют онлайн-сервисы, способные сопоставить хеши оригиналам простых слов (если соответствующие хеш-строки уже есть в используемой ими базе). Именно по этой причине не стоит выбирать для своих учетных записей слишком простые пароли.
Длина строки-результата всегда будет одинакова, независимо от размера исходного массива. Пароль пользователя, который сайт сохраняет на своем сервере, в хешированном виде имеет ту же длину, что и вся «Большая советская энциклопедия» – при условии, что они будут обработаны одним и тем же алгоритмом.
Если во всей «Большой советской энциклопедии» изменить всего лишь одну букву, хеш-сумма уже будет другой. То же самое произойдет при изменении всего одного байта в любом файле – программе, видео, документе.
Чаще всего хеширование применяется для хранения паролей и платежных данных банковских карт (на различных серверах). Другие повседневные сферы применения:
- подтверждение авторства электронного документа;
- индикатор неизменности системных файлов;
- операции в криптовалютных системах;
- поиск в торрент-сетях;
- обнаружение дубликатов на жестком диске;
- контроль целостности и подлинности скачанного файла.
Для расчета хеш-сумм используются специальные программы. Например, бесплатные HashTab и HashMyFiles. Рассчитанные с их помощью хеши (их также называют контрольными суммами) служат своеобразным цифровым удостоверением для файлов.
Если такую подпись указать на веб-странице, с которой происходит скачивание файла, пользователь может быть уверен, что не скачал вместе с программой какой-нибудь троян.
Практически любой менеджер загрузок можно настроить на автоматическую проверку соответствия скачиваемого материала необходимой контрольной сумме. Это особенно удобно при загрузке объемных многотомных архивов.
Шифрование
Шифрование делает информацию нечитаемой без использования соответствующего секретного ключа. Для шифрования и обратного преобразования в читаемый вид может использоваться один и тот же ключ. Такое шифрование называется симметричным.
В случае использования двух ключей шифр называется ассиметричным. Этот тип шифрования использует открытый ключ для шифрования, и закрытый – для расшифровки.
С ассиметричным шифрованием пользователи взаимодействуют каждый день: на нем базируются все основные сетевые протоколы передачи данных – HTTPS,TLS, SSH. Первый протокол используют браузеры, второй – мессенджеры, IP-телефония.
Протокол SSH позволяет удаленно редактировать файлы сайта на сервере хостинг-провайдера. Он также применяется для зашифрованной трансляции видео с веб-камеры.
В самом общем смысле, цель шифрования заключается в предотвращении несанкционированного доступа к информации путем предоставления соответствующего ключа только авторизованным пользователям.
Кодирование
Цель кодирования заключается в преобразовании информации в определенную последовательность бит (или символов) для удобства дальнейшей обработки. При этом каждому биту передаваемой информации соответствует свой набор уровней электрических сигналов (для кабельных сетей).
В беспроводных сетях закодированная информация передается методом модуляции высокочастотных сигналов. Это известные любому пользователю Bluetooth и Wi-Fi.
В самом компьютере информация кодируется в определенный набор символов. На сегодняшний день распространены три основных типа кодировки:
- ASCII-совместимые;
- UTF-8;
- EBCDIC-совместимые.
Обычному пользователю эти термины ни о чем не говорят, пока он не получит по электронной почте нечитаемую абракадабру. Или не попытается открыть кириллический readme-файл на компьютере с англоязычной версией операционной системы Windows.
Несложные манипуляции на сайте, предоставляющем услуги по раскодированию, помогают привести абракадабру в читаемый вид.
Другой случай, когда понимание вида кодировки может пригодиться – создание собственной веб-страницы.
Еще одно повседневное проявление кодирования информации – различные кодеки видео и аудио: mp3, flac, xvid, hevc. Их назначение, помимо непосредственной передачи информации – сжатие до приемлемого соотношения качества и объема.
Пример совместной работы
Проще всего проиллюстрировать концепции шифрования, кодирования и хеширования можно на примере ТВ-сериала, упакованного в архив и скачанного из торрент-сети:
- Видео и аудио-дорожка были обработаны кодеками для уменьшения размера – это кодирование. В процессах скачивания и просмотра происходят операции кодирования /раскодирования.
- Файлы были сохранены в архиве с паролем – симметричное шифрование.
- Сериал был найден торрент-клиентом по хеш-тегу, по окончании скачивания программа проверила целостность файла – хеширование.
Кодирование использовалось, чтобы сжать сериал, передать его по сети, посмотреть на любом устройстве. Шифрование было нужно, чтобы сериал посмотрели только пользователи определенного трекера. Хеширование применялось, чтобы не открыть архив с трояном.
Главные различия между шифрованием, хешированием и кодированием
Кодирование и шифрование, хотя их часто считают синонимами, выполняют разные функции. Кодирование преобразует информацию для передачи и дальнейшего использования. Шифрование же делает информацию бесполезной для постороннего пользователя.
От хеширования шифрование отличается обратимостью. Если иметь (подобрать) ключ, восстановить зашифрованную информацию не составляет труда. По мере роста вычислительных мощностей ключи симметричного шифрования должны становиться длиннее.
Хеширование изменяет информацию необратимо. Хотя теоретически исходные данные получить можно, на практике подобная вычислительная задача практически неосуществима.