Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!
В декабре 2020 года IBM Research и Fujifilm представили прототип картриджа LTO на 580 терабайт. Небольшая кассета с магнитной лентой вмещает информации как несколько десятков обычных HDD или 120 000 DVD.
Магнитные ленты появились почти сто лет назад, а компьютерные файлы на них записывают с 1952 года. Ещё наши мамы в советских НИИ меняли катушки на мейнфреймах. И в 2021 году плёнки остаются самым дешёвым накопителем со стоимостью хранения примерно в 6 раз ниже, чем на HDD. Поскольку плёнка практически исчезла с потребительского рынка, многие даже не знают, насколько бурно развивается эта технология.
Катушки с магнитными лентами производства Orwo (ГДР) в советском мейнфрейме ЭВМ ЕС-1020 на кафедре прикладной математики физмата Ленинградского политехнического института, середина 1980-х. Скорость чтения/записи составляла 2 метра (64 килобайта) в секунду, источник
Немножко истории
Вообще, магнитную ленту изобрёл немецкий химик Фриц Пфлёймер в 1928 году, то есть 93 года назад. Он первым догадался сделать напыление магнитным порошком из оксида железа на тонкой бумаге с помощью клея. Первую ленту изготовил немецкий концерн BASF. Сначала её использовали для записи звука, а в 50-е годы начались эксперименты по записи видео, а также цифровых компьютерных данных, причём второй вариант использования считался гораздо перспективнее, потому что магнитные видеокассеты всё равно не могли сравниться с киноплёнкой по качеству изображения.
Первая в мире лента с цифровыми данными была записана и считана магнитными головками Uniservo I для компьютера UNIVAC I в 1951 году. На той ленте шириной полдюйма (12,65 мм) данные записывались с плотностью 100 символов на дюйм.
Магнитные головки Uniservo I
Потом за дело взялась IBM, которая выпустила 7-дорожечные ленты такой же ширины в полдюйма.
Модель IBM 726 сохраняла 2 мегабайта на катушке. Устройство сдавалось в аренду по $850 в месяц, источник
Потом были разработаны 9-дорожечные ленты для системы IBM System/360. Девять дорожек позволяли записать в каждом положении ленты ровно один байт (8 информационных разрядов плюс 1 контрольный). Эти катушки на долгие 30 лет стали компьютерным стандартом, в том числе для советских компьютеров.
Накопители IBM 2401 для компьютеров System/360
Плотность записи
Плотность записи постоянно росла: до 200, 556, 800 символов на дюйм, затем у 9-дорожечных лент она составляла 800, 1600 и 6250 байт на дюйм. К 70-м запись достигла такой плотности, что стало возможным уменьшить ширину ленты. Так появились первые компактные кассеты и картриджи.
Стандарт QIC («картридж с лентой в четверть дюйма») представила компания 3M в 1972 году, Journey234
Linear Tape-Open (LTO) — один из современных стандартов для картриджей, который отличается максимальной плотностью записи.
Текущие ленты производятся с покрытием из феррита бария (BaFe). В каждом новом поколении LTO частицы становились всё мельче, компонуясь в более узкие дорожки данных. В декабре 2020 года Fujifilm и IBM анонсировали первую модель с покрытием из феррита стронция (SrFe). Размер частиц уменьшился на 60%.
Слева: строение ленты. Справа: Фотографии частиц из феррита бария и феррита стронция в покрытии. Изображение: Fujifilm
Плотность записи в лентах можно сравнить с аналогичным показателем HDD, потому что там используется схожий принцип хранения намагниченных бит в слое носителя на подложке.
Плотность записи на HDD в последнее десятилетие увеличивается на 9% в год, а у плёнки на 34%. Слайд из презентации IBM
Плотность записи на HDD замедлила рост в последнее десятилетие. Большие надежды возлагают только на термомагнитную запись (HAMR), где показатель превышает 2 Тбита/дюйм². До таких показателей LTO далеко.
Но уже при существующей плотности картриджи значительно обгоняют HDD по общему объёму информации, ведь площадь ленты на катушке гораздо больше площади блинов в винчестере. Конструкция картриджа позволяет задействовать одновременно 32 считывающие головки, что даёт преимущество по скорости чтения и записи, по сравнению с HDD.
Главное, что плотность записи на плёнку продолжает расти в геометрической прогрессии, примерно на 33% в год. То есть удвоение объёма накопителей происходит примерно раз в два-три года. Для сравнения, прогресс в производстве жёстких дисков сильно замедлился (если HAMR не оправдает надежд).
2006 | 2010 | 2014 | 2015 | 2017 | 2020 | |
---|---|---|---|---|---|---|
Плотность записи (Гбит на дюйм²) | 6,67 | 29,5 | 85,9 | 123 | 201 | 317 |
Ёмкость картриджа (ТБ) | 8 | 35 | 154 | 220 | 330 | 580 |
Ширина дорожки | 1,5 мкм | 0,45 мкм | 0,177 мкм | 0,14 мкм | 103 нм | 56,2 нм |
Линейная плотность (бит на дюйм) | 400 000 | 518 000 | 600 000 | 680 000 | 818 000 | 702 000 |
Материал магнитного слоя | BaFe | BaFe | BaFe | BaFe | CoPtCr-SiO2 | SrFe |
Толщина плёнки (мкм) | 6,1 | 5,9 | 4,3 | 4,3 | 4,7 | 4,3 |
Длина плёнки (м) | 890 | 917 | 1255 | 1255 | 1098 | 1255 |
Выходит, что плёночные картриджи сейчас — более перспективная технология, чем жёсткие диски. Плёнка развивается, рынок растёт, разработчики не жалеют денег на научные исследования и строят планы на десятилетия вперёд.
Особенности ленты
Надёжность
У ленточных накопителей относительно высокий срок гарантированного сохранения данных. Производители современных картриджей типа LTO обычно гарантируют сохранность информации от 15 до 30 лет.
Устройство картриджа в принципе проще, чем у SSD и HDD, где механизм для чтения и записи информации встроен внутрь накопителя, и этот механизм чрезвычайно сложный и подвержен поломкам. Например, распространённая причина выхода из строя SSD и HDD — сбой электроники в контроллере, а в HDD ещё повреждения головки. Плёночным картриджам в этом случае ничего не грозит. Вероятность ошибок при записи или чтении плёнки на 4-5 порядков ниже, чем у жёстких дисков.
Ещё одно преимущество картриджей — безопасность, поскольку накопители физически изолированы от сети.
Низкая стоимость
Если сравнить стоимость хранения 1 мегабайта на разных накопителях, то после превышения определённого объёма данных магнитная лента — самый выгодный вариант. Например, за $500 можно купить десяток кассет LTO-8 по 12 ТБ каждая. Для сравнения, HDD того же объёма обойдутся примерно в $3000.
Правда, сам привод LTO-8 стоит несколько тысяч долларов, так что на маленьких объёмах расходы не окупятся. В качестве малобюджетной альтернативы можно купить бэушный привод LTO-2 за $95 с кассетами 200 ГБ по 8 долларов, но это жутко устаревший лоутек.
Внешний привод MagStor LTO-8 HH SAS (LTO-8) для настольного компьютера стоит $3300
В отличие от домохозяйств, в корпоративных хранилищах выгода очевидна. Дополнительная экономия достигается за счёт сокращения капитальных затрат на строительство хранилища, сокращения административных расходов и оплаты электричества, поскольку для хранения кассет не требуется электропитание, как в случае с серверами. См. калькулятор стоимости владения (TCO) для корпоративного дата-центра.
Диски DVD в таких системах даже не рассматриваются. Например, для хранения хотя бы 5 ТБ требуется сотня дисков Blu-ray со смехотворной скоростью записи.
Скорость чтения и записи
Перемотка магнитной ленты — это механический процесс, который никак невозможно произвести за миллисекунды. Представьте, что для поиска файла требуется отмотать 200 метров ленты… Вообще, в современных картриджах LTO длина лента превышает 1 километр. Поэтому среднее время доступа к данным — десятки секунд, тогда как у жёстких дисков — от 5 до 10 миллисекунд. В реальности кроме перемотки кассеты нужно ещё найти нужную кассету в хранилище, что тоже нетривиальная задача (см. КДПВ).
В последней модели LTO скорость прокрутки ленты во время чтения/записи составляет около 15 км/ч (4 м/с), а головки позиционируется с точностью 3,2 нанометра.
Скорость последовательного чтения и записи на плёнку выше, чем у современных HDD. В последнем поколении LTO-9 чтение/запись происходит параллельно на 32 дорожки, а скорость достигает 400 мегабайт в секунду в секунду в несжатом виде или 1 ГБ/с в сжатом.
Ниши использования
Исходя из достоинств и недостатков плёнки понятны варианты её использования. Это надёжные накопители для дешёвого долговременного хранения с хорошей скоростью чтения/записи, но отсутствием мгновенного доступа. Таким образом, они лучше всего подходят для «холодного» хранения бэкапов.
Бэкапы
В 2011 году компания Google случайно удалила почту в 40 тысячах почтовых ящиках. Пострадали резервные копии на всех серверах. Данные удалось восстановить только с плёнки. Тогда и выяснилось, что Google тоже использует плёнку для резервного копирования, также как Microsoft и другие облачные провайдеры, не говоря уже об их клиентах.
Необычный пример долговременного резервного хранилища — GitHub Arctic World Archive на Шпицбергене. Причём это холодное хранилище и в прямом, и в переносном смысле. Оно размещается на глубине 250 метров в вечной мерзлоте и рассчитано на тысячу лет хранения.
Правда, там не магнитная лента, а фотоплёнка с галогенидами серебра в полиэфире производства норвежской компании Piql. У такой плёнки срок жизни минимум 500 лет.
Один кадр на фотоплёнке из бэкапа репозиториев GitHub, источник
Полный код 100 млн репозиториев в .tar занял 21 ТБ на 186 катушках. Вместе с архивом положили технические руководства по расшифровке QR и форматам, чтобы наши потомки сумели преобразовать QR-коды обратно в код и запустить его.
Облачные сервисы
Тарифы на холодное хранение данных предлагает Amazon и другие облачные провайдеры. Холодное хранилище гораздо дешевле, но извлечение данных дорогое. Например, в сервисе S3 Glacier Deep Archive хранение 1 терабайта стоит всего 1 доллар в месяц (доступ в течение 12-48 часов). Для сравнения, стандартное хранилище S3 в 23 раза дороже.
Информация в мировой инфраструктуре растёт как снежный ком по мере подключения миллиардов новых устройств. Согласно недавнему исследованию IDC, общий объём накопителей в глобальной мировой инфраструктуре вырастет с 16 до 163 зеттабайт за период 2016−2025 гг.
Сейчас число сверхкрупных дата-центров в мире достигло 597. Для них используется особый термин: Hyperscale Data Center (HSDC). В прошлом году было построено 52 подобных сооружения.
На Amazon, Microsoft и Google приходится более половины всех крупных ЦОД.
Наука
Некоторые современные научные инструменты генерируют такой огромный объём данных, что их невозможно хранить иначе, кроме как на ленточных накопителях. Например, Большой адронный коллайдер генерирует 140 ТБ в сутки, а гигантский распределённый радиотелескоп SKA (Square Kilometre Array) с тысячами параболических антенн будет выдавать до 1 экзабайта в день. Это сравнимо с объёмом трафика во всём мировом интернете (5,3 экзабайта в сутки в 2020 году).
Художественное представление массива антенн SKA. Изображение: SPDO/TDP/DRAO/Swinburne Astronomy Productions
Для таких научных инструментов два важнейших параметра — высокая ёмкость носителей и высокая скорость записи, а время доступа уже не так принципиально. Поэтому здесь и используются ленточные накопители.
По оценке IBM, сегодня в мире на магнитной плёнке хранится примерно 345 000 экзабайт данных. Получается, что плёнка в данный момент является основным накопителем человеческой цивилизации. И очень похоже, что в ближайшее время такое положение сохранится.
На правах рекламы
Закажите и сразу работайте! Создайте виртуальный сервер любой конфигурации в течение минуты, в том числе для хранения большого объёма данных до 4000 ГБ. Для хранения данных используем быстрое CEPH хранилище на NVMe дисках от Intel. Эпичненько :)