На русском - переведено
February 5, 2024

Будущее жёсткого диска.

Хранение данных.

14 сентября 1956 года IBM представила первый гражданский компьютер IBM 305 RAMAC с магнитным жестким диском для хранения данных. При весе около 1000 килограммов 305 RAMAC стал самым дорогим шкафом в мире. Его память в 4,4 мегабайта состояла из 50 магнитных дисков с двухсторонней записью. Каждый диск диаметром 60см вращался со скоростью 1200 оборотов в минуту.

Производитель предоставлял рабочее время вычислительной машины в аренду за 3200 долларов США в месяц. Сегодня это эквивалентно сумме в 100 миллионов долларов США за гигабайт хранилища.

Компьютер IBM 305 RAMAC и его жесткий диск в шкафу, 1956.

70 лет спустя гигабайт стоит сущие копейки. Информация, как правило, распределяется между несколькими накопителями и хранится в огромных дата-центрах, которые разбросаны по всему миру. Это облачная технология.

Погрузка на самолёт первого жёсткого диска ёмкостью 3.75 мегабайта из 50 пластин диаметром 60см. Стоимость составляла огромную сумму в 170000 долларов США. Месячная аренда ЭВМ обходилось потребителю в 3200 долларов.

Современное облако хранения данных предоставляет пользователю все возможности древнего IBM 305 RAMAC.

Действия по хранению, извлечению и вычислениям более не зависят от физической локации пользователя, времени суток. Облако - большой виртуальный контейнер, в который помещаются цифровые материалы для архивации, работы или игр. Доступ предоставляется круглосуточно из любого места. Для пользователя не имеет значения, где и как, в каком количестве частей, разделенных между различными аппаратными устройствами, хранятся данные.

Для облачных провайдеров инфраструктура материальна. Это защищённые помещения, дорогое оборудование, штат обслуживания. Комплекс работает на поддержку доступа к данным 24/7, наращивает ёмкости хранилищ по мере роста объёмов информации.

Современный дата-центр.

Статистика от "Интернейшнл дата корпорейшн" говорит, что в мире было сгенерировано около 123 зеттабайт ( 123 триллиона гигабайт) данных только за 2023 год.

Представьте себе башню из DVD-дисков, которая с каждой секундой становится выше на 1км. За год строение станет высотой более половины расстояния от Земли до Марса. Данные должны храниться рационально: электронные таблицы должны быть доступны мгновенно, а, например, архивные материалы можно разместить и подальше, на "чердаке".

Как организовать хранилище, обеспечив быстрый доступ?

Жёсткий диск компьютера.

Для начала подчеркнём, различные типы данных требуют разного подхода к хранению в зависимости от стоимости, условий и скорости доступа, видов носителей.

Внутри неброского здания в Дидкоте, Англия, в отделе научных вычислений лаборатории Резерфорда Эпплтона, одной из национальных научно-исследовательских лабораторий Великобритании, обитают Астерикс и Обеликс. Это имена пары хранилищ огромных объемов данных.

Астерикс и Обеликс - роботизированные библиотеки - крупнейшие по величине в Европе. Вместе они хранят и систематизируют поток научных данных, поступающих в результате экспериментов по физике элементарных частиц на Большом адронном коллайдере, наряду с различными другими видами климатических и астрономических исследований.

Астерикс и Обеликс - часть облака научной лаборатории. Этот кластер способен хранить 440000 терабайт данных, что эквивалентно миллиону копий трех фильмов "Властелин колец" в 4К формате наивысшего качества. Каждый кластер состоит из ряда ячеек-шкафчиков, заполненных кассетами с лентой; если бы все кассеты были размотаны, лента протянулась бы от Афин до Сиднея.

Когда ученый запрашивает информацию, один из нескольких роботов перемещается по горизонтали на направляющих и по вертикали, чтобы найти нужную ячейку с магнитной лентой. Затем лента извлекается и происходит считывание записанных данных. Весь процесс занимает менее минуты.

Магнитная лента, подобная той, что используется в старых аудиокассетах, может показаться странным выбором для хранения передовых научных исследований. Но современная лента невероятно дешевая и плотная (плотность данных увеличивалась в среднем на 34% ежегодно в течение десятилетий). Это возможно благодаря уменьшению размера магнитных частиц, называемых "зернами", в которых хранится информация, при более плотной упаковке-записи.

Один картридж, размером с пару аудиокассет, вмещает 40 терабайт данных. Это соответствует почти одному миллиону IBM 305 RAMAC-ов. Картридж долговечен и требует минимум энергии для обслуживания. Эти качества делают магнитную ленту предпочтительным носителем не только для научных записей, но и для больших объемов облачных данных Амазон, Гугл и Микрософт.

Флэш-память, используемая в ноутбуках и телефонах, лучше подходит для тех случаев, когда требуется часто просматривать или изменять данные, например, фотографии. Твердотельные накопители сохраняют информацию, улавливая или высвобождая электроны в сетке ячеек флэш-памяти. Извлечение данных просто и не требует движущихся механических частей; занимает около одной десятой миллисекунды. Хотя, если информация хранится в облаке, а не на телефоне, добавьте несколько десятков миллисекунд для доставки. Данные сохраняются даже при выключенном питании. Следует помнить, что флеш-память в конечном итоге разрушается и не является долговечной.

По мере того как новые фотографии, которые вы делаете, отправляются в центр обработки данных, старые фотографии перемещаются с флэш-памяти на старомодные жесткие диски, распределенные по нескольким центрам обработки данных. Центры могут располагаться за рубежом и даже на других континентах.

Информация в дата-центрах механически считывается и записывается на вращающийся магнитные диски, особо не отличающиеся от старичка IBM RAMAC 305. Но b[ стоимость в пять раз дешевле за гигабайт памяти, чем флеш-носителе (этот разрыв сокращается). Поиск занимает 5-10 миллисекунд.

Дата-центр.

Устройство хранения информации у провайдера обезличено. Один из способов, которым это делается, называется RAID (массив независимых дисков). Для этого требуется несколько аппаратных устройств хранения данных и они обрабатываются как одно виртуальное хранилище. В RAID-массиве фотография разбивается на несколько частей, так что ни одно аппаратное обеспечение не содержит ее целиком, а несколько устройств хранения имеют слегка перекрывающиеся фрагменты. Даже если две аппаратные части ломаются (аппаратные сбои случаются), фото можно будет восстановить.

Надёжность хранения обеспечивается и дублированием. Каждая часть данных будет храниться, по крайней мере, в трех отдельных местах. Если ураган, торнадо или лесной пожар уничтожат один из центров обработки данных, в котором хранилась копия фото, останутся ещё пара копий резервного копирования. Дублирование помогает повысить надежность облачных хранилищ. Это также значит, что большую часть времени миллионы жестких дисков находятся в режиме ожидания, на всякий случай.

Провайдеры хранилищ постоянно работают над повышением их надежности. Лента-носитель, в частности, имеет свои недостатки. Ей необходимы определенные диапазоны температур и влажности, защита от воздействия сильных магнитных полей, которые могут стереть информацию. Лента требует замены раз в десятилетие или два. Сегодня ведется поиск альтернативного хранителя информации.

Стекло - носитель и хранилище данных.

Стекло - перспективный материал. Быстрый точный лазер вытравливает крошечные точки в несколько слоев на стеклянных пластинах площадью 75кв.мм и толщиной 2мм. Информация сохраняется по длине, ширине, глубине, размеру и ориентации каждой точки.

Кодирование информации в стекле является современным эквивалентом гравировки на камне. Если обжарить, накалить, расцарапать или даже обработать в микроволновке такое стекло, данные сохранятся и прочитаются.

Микрософт делает ставку на стекло, как надёжный носитель данных, в соей программе "Проект Силика".

Исследователи из "Микрософт" используют запись информации на носитель-стекло. Каждый стеклянный слайд вмещает чуть более 75 гигабайт. Машинное обучение повышает скорость считывания. Разработчики утверждают, что слайды прослужат 10000 лет. Дополнительно "Микрософт" создала систему (во многом похожую на ленточных роботов), которая может обрабатывать тысячи или даже миллионы запросов информации с хранилищ стеклянных слайдов.

Масштабирование технологии приведёт к созданию принципиально новых надёжных облачных хранилищ информации.