Копирование на ленту: эпоха Ренессанса
Ленточные библиотеки остаются ключевым компонентом стратегии архивирования и жизненного цикла хранения данных.Перед ИТ-департаментами в ближайшие годы стоят непростые задачи: необходимо обеспечивать сохранность информации и защиту от технических сбоев, в то время как ИТ-бюджеты не успевают за темпами роста объемов данных.
Слухи о смерти...
По данным IDC, с 2010 по 2020 год их количество в мире вырастет в 44 раза. За этот период емкость систем хранения увеличится в 30 раз, а численность персонала — всего в 1,4 раза. Каждому администратору придется управлять намного бо,льшим объемом данных, нежели сейчас.
Автор: Наталья Жилкина. Впервые опубликовано в журнале "CIO: руководитель информационной службы" № 11 за 2012 год.
И все-таки возможности для контроля над массивами данных имеются даже у компаний, не располагающих свободными средствами на приобретение дополнительных дисковых накопителей и увеличение штата квалифицированных сотрудников. В условиях появления огромных массивов данных значительную часть проблем решают ленточные технологии.
Говоря о ленте, некоторые представители отрасли (в основном производители исключительно дисковых систем хранения) выражают скептицизм. «Большинство компаний сейчас практически не используют ленточные накопители для резервного копирования данных, для систем восстановления, — утверждает Адриан Макдональд, президент корпорации EMC в регионе EMEA. — Причина состоит в том, что разрыв по цене между накопителями на лентах и на дисках значительно уменьшился». Впрочем, не исключено, что причина самого заявления кроется в том, что в портфеле систем хранения компании EMC ленточные библиотеки отсутствуют.
Между тем исследование компании Fleishman-Hillard Research свидетельствует о том, что 70% всех компаний используют диски и ленты для хранения информации, а 53% этих компаний планируют серьезно увеличить объем использования ленточных технологий для хранения данных. Даже предприятия, использующие D2D-технологии резервного копирования, активно переходят на ленты для хранения резервных копий и архивов.
Андрей Вересов, руководитель развития продаж систем хранения данных Hewlett-Packard в центральной и восточной Европе, считает, что будущее за комбинированным использованием ленточных библиотек и дисковых библиотек с дедупликацией для резервного копирования и восстановления данных. Что касается долгосрочного архивирования данных, здесь лента не имеет конкурентов из-за своей способности дешево и надежно хранить данные.
ПО ДАННЫМ FLEISHMAN-HILLARD RESEARCH 53% КОМПАНИЙ ПЛАНИРУЮТ СЕРЬЕЗНО УВЕЛИЧИТЬ ОБЪЕМ ИСПОЛЬЗОВАНИЯ ЛЕНТОЧНЫХ ТЕХНОЛОГИЙ ДЛЯ ХРАНЕНИЯ ДАННЫХ
Показательно, что компания Oracle после приобретения Sun Microsystems признала подразделение ленточных технологий перспективным и не закрыла его, а продолжает развивать. Корпорация IBM практически с самого начала развития вычислительной техники уделяет немало внимания ленточным технологиям. Такой же позиции придерживаются HP, лидирующая в сегменте производства LTO-приводов, Quantum и др.
По всем параметрам терабайт хранения информации на ленте стоит в несколько раз, несопоставимо ниже по сравнению с дисками. «Лента остается самым дешевым носителем информации, если сравнение проводить с учетом стоимости оборудования, владения и носителя, — говорит Александр Чичковский, генеральный директор компании Storus. — Она позволяет экономить деньги заказчика на электричестве, охлаждении и занимаемом месте в серверной, имеет высокую скорость последовательной записи и возможность использования WORM-технологии, долго и надежно хранит данные».
Лента и теперь живее всех живых
Мнение о том, что лента морально и технологически безнадежно устарела, бытует на рынке давно. Действительно, последнее десятилетие было отмечено бурным ростом продаж дисковых систем хранения, преимущества которых говорят сами за себя: диски обеспечивают быстрый доступ к данным, хорошо масштабируются, апгрейд дисковой системы обойдется дешево.
«На протяжении нескольких лет активно продвигалась идея, что дисковая система является универсальной, диски можно использовать не только для текущей обработки данных, но и для резервного копирования и архивирования, — рассказывает Дмитрий Алексеев, консультант компании Fujifilm. — Однако время показало, что в целом актуальность ленты не изменилась. Диски действительно используются для горячего бэкапа, для оперативной работы. А вот в режиме отложенных запросов к данным на первый план выходит лента».
Владимир Слизов, руководитель группы технической поддержки продаж решений IBM System Storage компании IBM в России и странах СНГ, подчеркивает, что пределы уплотнения диска исчерпаны. На данный момент объем жесткого диска и ленточного картриджа практически сравнялся. Но размер того объекта, который представляет один бит информации, на ленте на несколько порядков крупнее, чем на диске.
— К тому же специалисты начали обращать внимание и на такой параметр, как энергопотребление дисковых систем хранения, — говорит Слизов. — Увеличение скорости вращения диска с 15 до 20 тыс. оборотов в минуту столкнулось с проблемой резкого (в разы) увеличения потребления электроэнергии и выделяемого тепла. Ведь дисковый массив постоянно (даже в неактивном состоянии) расходует электроэнергию на вращение шпинделей. А в ленточной библиотеке электроэнергию потребляет лишь ленточный привод, причем небольшую: IBM TS1140 и HP\IBM LTO5 потребляют порядка 50Вт, при том, что дисковые системы потребляют киловатты электроэнергии.
Что же касается скорости передачи данных, то и этот параметр сегодня сопоставим со скоростью работы дисковых подсистем. Демонстрация на стенде (устройств для библиотеки еще нет) работы картриджа емкостью 35 терабайт на скорости записи/чтения примерно в 10 Гбит/с (совместная технология IBM и Fujifilm) иллюстрирует новые возможности ленты, не уступающей дискам по своим ключевым параметрам — емкости и скорости чтения/записи с загруженного картриджа. Преимущества ленточных технологий представлены на рис. 1, 2, 3.
По словам Дмитрия Алексеева, ленты не только не уходят с рынка, но и завоевывают на нем все новые позиции: несколько лет тому назад ленточные системы занимали около 10% от объема продаж всех хранилищ. В настоящее время и в мире, и в России можно говорить о 15%.
«Есть еще две небольшие особенности, которые всегда ставили ленте в укор, — поясняет Дмитрий Алексеев. — Первое: ее нужно перематывать, чтобы она не размагничивалась. Но в современных картриджах лента не размагничивается без перемотки при длительном хранении, как это было раньше (до LTO4).
Второе — сложность и недоступность управляющего софта для ленточных библиотек. В настоящее время и эта трудность преодолена: благодаря распространению технологии LTFS с лентой стало работать так же просто, как с флеш-накопителем».
Специалисты резюмируют: с ростом тенденции к Big Data у ленты появляется огромный потенциал. Некоторые аналитики вообще считают, что жесткие диски уйдут с арены Storage, а на их месте останутся флеш-накопители и лента. Это утверждение подкрепляется технологическим прорывом в области энергонезависимой памяти на основе фазового перехода — Phase-change memory (PCM). Это новый тип памяти, основанной на уникальном поведении халькогенида: при нагреве этот материал может «переключаться» между двумя состояниями — кристаллическим и аморфным. Создатели технологии PCM попытались превзойти флеш-память, имеющую некоторые практические проблемы. PCM намного более надежна, выдерживает гораздо большее количество циклов перезаписи. В настоящее время уже получена хорошая устойчивость этой памяти, довольно высокая производительность и ожидается, что она будет дешевле, чем обычная флеш-память.
Победителей не судят
В 1988 году DEC произвела революцию на рынке, предложив новый класс ленточных накопителей, обладающих высокой емкостью и скоростью записи, а также обратной совместимостью по записи и чтению с их предшественниками. Ленточная система TF85 TK70 (позднее названная DLT 260) стала первым приводом DLT, способным вместить 2,6 Гбайт на полудюймовой ленте длиной 365 м. Менее чем через два года после ее появления инженеры DEC сумели увеличить емкость памяти почти десятикратно. Эта разработка специалистов DEC, известная в отрасли как DLTtape, получила широкое признание и до конца 1990-х годов заняла лидирующее положение в среднем сегменте рынка ленточных накопителей. Ее применение вышло далеко за рамки резервного копирования, охватив архивирование, восстановление после катастроф, иерархическое управление хранением данных, резервное копирование в режиме реального времени, распределение видеопрограмм и графических файлов.
В 1994 году корпорация Quantum приобрела у DEC технологию DLTtape. В процессе ее совершенствования был предложен усовершенствованный формат хранения Super DLTtape (SDLT), обеспечивающий более быстрый доступ к данным и обратную совместимость по чтению с существующими картриджными системами DLTtape четвертого поколения. В середине 2000-х технология SDLT интенсивно развивалась, активно завоевывая рынок.
В 1997 году Hewlett-Packard, IBM и Seagate, стремясь противостоять монополии Quantum, объединились для создания нового открытого формата хранения данных на ленте. Его широкого распространения предполагалось добиться путем свободного лицензирования, чтобы он мог применяться любыми компаниями, специализирующимися на производстве накопителей или картриджей. Новый формат Liner Tape-Open (LTO) должен был обеспечить высокую скорость записи и чтения ленточными приводами файлов с картриджей высокой емкости. Вместимость картриджей LTO первого поколения составляла 100 Гбайт в несжатом виде, в каждом последующем поколении этот параметр удваивался.
«Перетягивание каната» между LTO и SDLT было довольно долгим. В октябре 2003 года Quantum выпустила привод SDLT 600, который превзошел LTO2 во всех отношениях (300 Гбайт, 36 Мбайт/с). Большую емкость (500 Гбайт) обеспечивал в то время только привод Sony формата SAIT, но он уступал по скорости (30 Мбайт/с).
К началу января 2004-го состязание двух технологий на самом массовом рынке ленточных устройств среднего класса привело к тому, что формат LTO занял 65% рынка, а SDLT — остальные 35%. Однако сегодня в новых продуктах SDLT практически никто не поддерживает. Победу в войне стандартов одержала технология LTO, на которую сегодня приходится около 90–95% рынка.
Де-факто на рынке существуют два основных стандарта. На сегодня LTO — наиболее универсальное открытое решение, которое поддерживают многие производители. Картридж LTO5 вмещает 3 Тбайт данных в сжатом виде. Следующая спецификация LTO6 была окончательно подтверждена в августе 2012 года, в первых числах октября компания IBM уже анонсировала модели оборудования, поддерживающего этот стандарт, а Quantum в середине ноября начинает поставки LTO6, с емкостью каждого картриджа в сжатом виде до 6 терабайт. Не за горами и новое поколение LTO7.
Другая технология, которую успешно развивает IBM, реализована в линейке оборудования IBM 3592. Компания поставляет в настоящее время, помимо библиотек LTO, стримеры собственного закрытого стандарта IBM 3592 (Jaguar), представленные современной моделью IBM TS1140, а также совместимые ленточные библиотеки. Устройства 3592 предназначены для круглосуточной работы в жестких полевых условиях. Отличительной особенностью стандарта IBM 3592 является заложенная в него возможность переформатирования магнитных носителей старого поколения под формат более новых устройств с соответствующим повышением информационной емкости (в отличие от других современных стандартов, обеспечивающих совместимость новых устройств со старыми носителями только в старом же формате). В общем случае предусматривается совместимость на два поколения вперед.
В НАСТОЯЩЕЕ ВРЕМЯ РЫНОК ПЕРЕЖИВАЕТ ЭПОХУ РЕНЕССАНСА ЛЕНТОЧНЫХ ТЕХНОЛОГИЙ. СВЯЗАНО ЭТО С ТЕМ, ЧТО БОЛЬШИЕ ДАННЫЕ НАДО ГДЕ-ТО ХРАНИТЬ
Среди недорогих решений начального уровня в середине 2000-х годов доминировала технология DDS: более 50% автономных накопителей комплектовалось соответствующими картриджами. По данным IDC, в первой половине 2004-го на поставки техники DDS/DAT пришлось 46% рынка ленточных продуктов всех категорий. Однако сегодня остановившаяся в своем развитии технология DDS практически ушла с рынка. До 8% рынка ленточных систем в 2004 году занимала также технология Sony AIT/VXT. Но этот стандарт не выдержал конкуренции с LTO. К тому же в 2011-м завод Sony залило цунами, и сейчас присутствие этого стандарта на рынке практически не ощущается.
Кружатся ленты
Производители оборудования Storage объявляют о дорожных картах развития ленточных технологий на годы вперед. Среди лидеров сегмента ленточных библиотек — компании HP, IBM, Oracle (Sun/StorageTek), Quantum, Overland. В числе основных производителей приводов — HP с приводами LTO, IBM с приводами LTO- и 3592, Oracle с приводами T10000 и 9840. Приводы LTO также производит компания Quantum. Приводы собственного стандарта AIT выпускает Sony. Производители картриджей — Fujifilm, Imation TDK, Maxell, Sony. Дорожные карты планируют несколько поколений приводов, которые будут появляться каждые 3–4 года.
— Производители постоянно развивают функционал ленточных библиотек: повышают их отказоустойчивость, вводят дублирующие компоненты, — отмечает Андрей Вакатов, заместитель директора департамента «Инжиниринговый центр» компании «Техносерв». — В новых библиотеках применяется модульная структура, обеспечивающая емкость по требованию. Зачастую добавление емкости может происходить без выключения питания на устройствах. Современные библиотеки поддерживают виртуализацию, их можно делить на логические устройства, что дает дополнительные возможности при эксплуатации. В настоящее время вендоры могут предложить ленточный комплекс емкостью до 100 тысяч слотов, что даст заказчику до 1 000 ПБайт емкости хранения. Примером такой ленточной библиотеки может служить устройство SL8500 с приводами T10000C производства Oracle. Ленточная библиотека IBM TS3500 поддерживает рост до 200 000 картриджей и объем 2,7 экзабайт.
Альянс компаний-производителей устройств на базе технологии Linear Tape-Open (LTO) — HP,IBM и Quantum — анонсировал технологию LTO6 с емкостью картриджа 6,25 Тбайт (с компрессией) и скоростью передачи данных до 400 Мбит/с. Компания IBM уже объявила о выпуске привода LTO6. На сегодня самый емкий картридж для привода — T10000C емкостью 5 Тбайт, совместная разработка компаний Oracle и Fujifilm. Самый быстрый привод, TS1140 производства IBM, обеспечивает скорость передачи данных 250 МБ/сек и объем 4ТБ на кассету.
«Заказчики постоянно задают вопрос о поддержке устаревших форматов типа DDS, DLT, — рассказывает Дмитрий Алексеев. — В настоящее время очень трудно найти картриджи для оборудования, которое работает на этих стандартах. Что же касается LTO, то здесь совершенно противоположная картина. По крайней мере, Fujifilm все еще производит картриджи первого поколения LTO1. И обеспечивается обратная совместимость с предыдущими форматами на две ступени».
Big Data на ленту
Сергей Хюннинен, менеджер по развитию бизнеса компании Storus, отмечает, что сегодня лента наиболее широко применяется в двух сценариях — в архивном хранении и в качестве накопителя near-line в системе иерархического многоуровневого хранения, одной из наиболее передовых и эффективных технологий. В обоих случаях необходимы большой объем и надежность, а вот требования к скорости доступа менее важны.
«Лента находит широкое применение для организации файловых хранилищ, для размещения медиаконтента, в линейной или нелинейной обработке, видеомонтаже, — поясняет Хюннинен. — Данные, которые хранятся на ленте, по первому требованию копируются на быстрое хранилище и могут быть использованы».
Александр Чичковский отмечает, что в реальной жизни спрос на ленту растет, причем заметно: «Если происходит авария, катастрофа, отказ оборудования — ленту можно увезти на другую площадку и восстановить данные уже в другом месте. С дисковым массивом все не так просто».
Некоторое время тому назад широкое распространение в резервном копировании получила технология виртуальной ленточной библиотеки — VTL. Эта концепция по умолчанию подразумевает, что данные должны быть затем переброшены на ленту — ведь VTL готовит образы лент, с тем чтобы скопировать их именно на ленту. Однако этой фазой хранения, по словам Александра Чичковского, многие клиенты пренебрегали, потому что неправильно оценивали риски потери данных. Как правило, с рабочих дисков, с боевой системы через VTL делали копию на какое-то более дешевое дисковое хранилище, причем в том же самом дата-центре, в той же самой стойке, даже на том же самом питании, с теми же самыми системами охлаждения зала или серверной комнаты. А потом наступало жаркое лето, отключение систем охлаждения, остановка серверов, со всеми вытекающими последствиями.
— В настоящее время рынок переживает эпоху ренессанса ленточных технологий во всем мире, и в России в том числе, — считает Дмитрий Алексеев. — Прежде всего это связано с тем, что Большие Данные надо где-то хранить. По уровню надежности лучше лент пока ничего не придумано. Если с вышедшего из строя диска снять информацию удается далеко не всегда, то с ленты восстановить данные можно в 99,9% случаев. Даже если информация была стерта, все равно в специальных лабораторных условиях есть шанс ее восстановить.
Еще одно привычное заблуждение касается скорости ленты: принято считать, что запись и считывание информации производятся медленно. «Но это уже далеко не так, — подчеркивает Сергей Хюннинен. — Современные технологии LTO5 и выше обеспечивают скорость считывания информации с ленточного накопителя, сопоставимую со скоростью доступа к информации на диске (при условии что картридж загружен в привод). Правда, какое-то время уходит на то, чтобы выбрать из библиотеки нужный картридж и вставить в привод. Поэтому лента предпочтительна для архива. В противном случае на ней хранились бы и горячие данные».
Упражнение с лентой
Управление библиотекой вместе с приводами и картриджами осуществляется в рамках стандарта Linear Tape File System, который является совместным проектом консорциума производителей ленточных систем хранения и их компонентов.
Технология LTFS впервые была внедрена в картриджи LTO4. Но тогда никто LTFS не пользовался, потому что система была в некотором смысле экспериментальной. Когда ввели поддержку LTFS в современный текущий стандарт LTO5, появились и дистрибутивы под различные операционные системы — и эти инструменты стали более активно использовать.
К НАЧАЛУ ЯНВАРЯ 2004-ГО СОСТЯЗАНИЕ ДВУХ ТЕХНОЛОГИЙ НА САМОМ МАССОВОМ РЫНКЕ ЛЕНТОЧНЫХ УСТРОЙСТВ СРЕДНЕГО КЛАССА ПРИВЕЛО К ТОМУ, ЧТО ФОРМАТ LTO ЗАНЯЛ 65% РЫНКА, А SDLT — ОСТАЛЬНЫЕ 35%. ОДНАКО СЕГОДНЯ В НОВЫХ ПРОДУКТАХ SDLT ПРАКТИЧЕСКИ НИКТО НЕ ПОДДЕРЖИВАЕТ. ПОБЕДУ В ВОЙНЕ СТАНДАРТОВ ОДЕРЖАЛА ТЕХНОЛОГИЯ LTO, НА КОТОРУЮ СЕГОДНЯ ПРИХОДИТСЯ ОКОЛО 90–95% РЫНКА
«В эпоху до LTFS мы не могли пользоваться лентой как обычной флешкой, — поясняет Сергей Хюннинен. — Необходима была специальная программа, интерпретирующая данные с ленты в файловую систему серверов. Благодаря LTFS мы пользуемся ленточными приводами и накопителями как обычной флеш-памятью. Пользователю не нужно знать, как работают все эти механизмы. Картридж автоматически размечается на сектора, дорожки, задаются специальные обозначения и метки, по которым осуществляется запись, — то есть LTFS является полноценной файловой системой. Технология позволяет при работе с приложением абстрагироваться от уровня управления лентой. И приложения, оперирующие большими объемами данных и традиционно работающие с дисками, теперь могут работать с лентой как с диском. Для небольших ленточных устройств без робота этот софт можно скачать бесплатно и сразу же использовать».
Те пользователи, которые раньше уже работали с лентами и применяют уже установленные у себя мощные пакеты для работы с лентой вроде XenData Software, IBM Tivoli, Quantum StoreNext, HP Storage Data Protector, как правило, продолжают пользоваться привычными инструментами. Но компании, интегрирующие в свою инфраструктуру новые решения, во многих случаях выбирают LTFS. Во-первых, это бесплатно, а во-вторых, есть дополнительные сервисы и поддержка IBM на платной основе, если это необходимо. Однако сервисов в LTFS пока меньше, чем у давно разработанных пакетов, хотя это дело времени.
При работе с библиотекой LTO5 система LTFS может быть реализована как программно, так и аппаратно. В первом случае это ПО, которое устанавливается на управляющий сервер, а во втором случае это контроллер внутри привода. Начиная с шестого поколения система LTFS аппаратно поддерживается всеми приводами и не требует установки на управляющие сервера.
Комбинационная задача
Чтобы избежать ситуации, когда предполагавшийся изначально сценарий использования библиотеки не работает (слишком много времени занимает передача информации, плохая совместимость оборудования, необъяснимые эпизодические сбои, никто из поставщиков не берется поддерживать весь комплекс в целом), необходима тщательная подготовка проекта.
— Когда мы рассчитываем проект по ленточному хранению, то предлагаем заказчику специальный список вопросов, — сообщает Александр Чичковский. — Отвечая на них, ИТ-директор сам для себя многое проясняет.
Специфика проектов, в рамках которых предполагается поставка ленточных библиотек, состоит в правильном расчете типов и количества накопителей и картриджей, а также соответствующих каналов передачи данных. Еще на начальном этапе следует определить объем и тип информации, частоту резервирования данных, размер окна резервного копирования и правила ротации носителей. Расчет комплекса резервного копирования требует учесть и такие нюансы, как метод резервного копирования — полное или инкрементальное, а также необходимость максимальной автоматизации процесса. Исходя из этого, определяется количество приводов и рассчитывается пропускная способность канала, по которому библиотека соединяется с внешней инфраструктурой. Выбор типа ленты представляется важным с точки зрения экономии. Пример: объем данных в компании, которая ведет аэрофотосъемку, просто гигантский, а окно резервного копирования ограничено несколькими часами в сутки. Поэтому используются картриджи небольшого объема, и запись осуществляется параллельно на несколько приводов, по нескольким каналам передачи данных. С учетом этого же требования рассчитывается и производительность библиотеки.
Секреты долгожительства
АНДРЕЙ ВАКАТОВ, ЗАМЕСТИТЕЛЬ ДИРЕКТОРА ДЕПАРТАМЕНТА «ИНЖИНИРИНГОВЫЙ ЦЕНТР» КОМПАНИИ «ТЕХНОСЕРВ»
Ленточные технологии прочно заняли свое место в иерархии систем хранения данных практически с самого начала развития ИТ-технологий. Это место они сохраняют за собой и по сей день. Согласно этой иерархии, в системе хранения данных можно выделить три яруса хранения: электронную, дисковую и ленточную память. Каждому уровню памяти соответствуют свои значения основных характеристик хранения, среди которых — быстродействие, емкость, цена и срок хранения.
Если электронная память самая быстрая, то она также наиболее дорогая и наименее емкая, при этом основная разновидность этой памяти энергозависима. Ленточные технологии хранения относительно медленные, но они обладают практически неограниченной емкостью и мобильны. Ленточные картриджи легко извлекаются, транспортируются и без труда воспроизводятся на аналогичных накопителях в других местах. При этом хранение их энергонезависимо и долгосрочно (до 30 лет).
Ленты как носители информации также характеризуются ограниченностью физического доступа к ним; особо охраняемую информацию можно извлекать из устройства и хранить в труднодоступных охраняемых помещениях, при этом нет никакой возможности получить несанкционированный доступ к информации через компьютерную сеть. Для обеспечения дополнительных возможностей по защите информации все современные промышленные ленточные устройства записи/чтения на магнитных лентах, приводы предлагают возможность криптографии информации; даже если картридж будет случайным образом утерян, прочесть информацию на нем будет крайне сложно.
Все эти преимущества делают ленточные технологии чрезвычайно привлекательными для резервного и архивного хранения данных. А при больших архивах (более 20 Пбайт) они практически безальтернативны. Кроме того, на данный момент хранение информации на лентах в десятки раз дешевле, чем на дисках, и в обозримом будущем это останется так.