Кластеризованные системы хранения данных. NAS-решение от Isilon Systems
Если рассматривать эволюцию СХД с точки зрения формирования емкости хранения, то на начальном этапе это был конструктив из RAID-контроллера и набора дисков без возможности увеличения скоростных и емкостных показателей системы. RAID-контроллеры в подобных системах позволяли строить RAID-сеты базовых уровней максимум из 16 дисков. Расширение емкости дополнительными модулями или дублированием RAID-контроллеров было невозможно.На сегодняшний день доступны системы с 2-мя контроллерами, работающими в режиме «оба активные». Сами контроллеры также претерпели значительные изменения, и из чисто аппаратных превратились в программно-аппаратные комплексы с встроенными ОС. Помимо создания RAID- сетов, пользователям стали доступны сервисы резервного копирования, виртуализации, удаленной репликации и т.д. Емкость таких СХД расширяется путем добавления дополнительных «дисковых полок», которые с использованием различных интерфейсов подключаются к RAID- контроллерам. Именно на них осуществляются все операции по управлению дисковым пространством. Такие системы используют классический принцип управления томами данных.
Классические СХД с выделенными контроллерами могут иметь до 16-ти портов со скоростью подключения до 8 Gb\s на каждом из двух RAID контроллеров. Однако это не означает, что суммарная пропускная способность системы составляет 256 Gb\s.
Будем считать, что скорость системы определяется скоростью самого медленного ее компонента. Исторически наиболее узким местом СХД являются жесткие диски. Именно поэтому производительность системы в большинстве случаев определяется параметрами RAID-сета. В среднем один жесткий диск SAS 15K способен отдать порядка 70 MB\s, и этот показатель можно увеличить, собрав несколько дисков в RAID-сет. Отметим, что линейный прирост производительности при этом получить не удастся. Помимо этого большинство систем хранения не позволяют собирать RAID-сеты более чем из 16 дисков. Соответственно, при использовании RAID 0 на 16 дисках существует возможность получить пропускную способность порядка 300 MB/s, что соответствует приблизительно 2.4 Gb/s на выходе.
Емкость классических СХД зачастую ограничивается примерно сотней дисков, поддерживаемых одним контроллером, что позволяет получить объем около 200 TB в пределах одной системы. Для последующего увеличения объема используются алгоритмы виртуализации с объединением нескольких физических систем хранения в одну логическую.
Следующим этапом развития СХД можно считать внедрение кластерной технологии, благодаря которой операции по управлению дисковым пространством осуществляются на каждом из узлов системы. Каждая «дисковая полка» обладает собственной логикой и интерфейсами передачи данных, а вкупе они составляют единую систему. В решениях такого уровня исключаются «узкие места» в виде выделенных RAID-контроллеров
Для решения задач, требования которых выходят за рамки классических СХД, применяются решения с использованием кластеризованных систем с емкостью от 9 до 5000 ТВ и с производительностью до 360 Gb\s.
Компания Isilon Systems предлагает инновационное модульное решение для достижения высокой производительности и обеспечения больших объемов хранения. Основой решения от Isilon является уникальная файловая система OneFS, с помощью которой можно выбрать, добавляются дополнительные узлы для увеличения объема или для повышения производительности.
Отдельные модули системы представлены как единый большой том для хранения данных, а перспектива их добавления без прерывания производственных процессов, открывает широкие возможности масштабирования. Коммутация модулей обеспечивается подключением по технологии Infiniband, что позволяет минимизировать задержки на уровне транспорта данных между узлами системы.
Продукт от Isilon Systems можно отнести к кластеризированным системам хранения данных. Классические системы хранения оптимизированы под структурированные данные и решают 2 задачи: либо обработка запросов ввода/вывода (IOPS), либо обработка потока данных (полоса пропускания MBPS). Система Isilon адаптирована для работы с неструктурированными данными, а принцип кластеризированного построения позволяет одинаково хорошо справляться как с обработкой потоков, так и с обработкой запросов ввода/вывода.
На сегодняшний день модельный ряд СХД от Isilon Systems включает в себя три линейки продуктов:
IQ S-Series: линейка этих систем реализована на базе узлов хранения IQ 5400S, с дисками SAS и адаптирована под обработку большого количества запросов, более 1,7 миллиона IOPS\сек. Объем такой кластеризированной системы может достигать 518 TB одним томом. Скорость можно повысить, если использовать узлы с SSD дисками.
IQ X-Series: в линейке предусмотрены узлы хранения с различной емкостью от 1.9 до 72 ТВ. В зависимости от задачи, существует возможность комбинировать узлы хранения с различным объемом. Пропускная способность такой системы может составлять до 45 Gb/s, при доступном объеме 5200TB.
IQ NL-Series: узел хранения IQ 72NL этой линейки построен на базе SATA-дисков специально для решения задач, в которых критическим параметром является объем. Конструкция шасси позволяет размещать до 36 дисков в корпусе с высотой 4U. Максимально высокая плотность монтажа в стойке 19” особенно актуальна, если стойки арендуются у крупных провайдеров и оплата производится из расчета за каждый заполненный юнит. Емкость такой системы может достигать 10400TB.
Для всех линеек существует одна общая особенность: при добавлении узлов хранения в кластер происходит как увеличение емкости, так и увеличение пропускной способности.
Непосредственно для увеличения производительности предусмотрены дополнительные модули Performance Extension Nodes - своеобразные промежуточные буферы, которые повышают производительность систем IQ S-Series и IQ X-Series и их пропускную способность (GB/s), не увеличивая емкость системы хранения.
Для линейки IQ X-Series существует возможность бюджетного расширения емкости. Capacity Extension Nodes - это SBOD система, которая подключается посредством интерфейса SAS (12Gb/s) и позволяет расширять объем хранения дополнительными жесткими дисками SATA. При этом дорогостоящая логика управления кластеризованным хранилищем заменена на контроллеры ввода/ вывода и такие системы имеют существенно более низкую стоимость.
Резервирование в продуктах Isilon Systems осуществляется как на уровне дисков, так и на уровне отдельных узлов хранения в зависимости от заданных администратором политик, определяющих, какое количество вычислительных узлов и/или дисков будет выделено. В случае выхода из строя отдельных дисков или узлов системы обеспечивается полная работоспособность при незначительном падении скорости. При замене неисправных компонентов скоростные показатели системы полностью восстанавливаются в автоматическом режиме.
На данный момент на рынке представлено достаточно большое количество различных NAS-продуктов. Основной особенностью большей части из них является использование наследуемых решений и технологий построения СХД. В таком случае, кроме проверенных, отработанных и надежных решений, возникает и комплекс проблем, которые имеют место в силу существующего подхода – ограничения по производительности, масштабированию, сложности при настройке и управлении системой, низкий процент использования RAW емкости. Вторым важным параметром, характеризующим потребности рынка этих систем, является лавинообразный рост так называемых неструктурированных или неиндексированных данных – информации, не относящейся к базам данных или инженерным расчётам заказчика. В качестве примера можно рассмотреть большие объёмы хранения медийных данных (изображения, звуки, фотографии) или данных научных экспериментов для дальнейшей обработки. Инновационный продукт от Isilon практически идеально подходит для гетерогенных сред обработки файлов, например в телеиндустрии или у провайдеров, предоставляющих контент по запросу клиентов. Его так же можно применять в качестве централизованного хранилища для HPC систем. Важнейшим параметром, позволяющим получить существенный выигрыш при использовании Isilon, являются лёгкость и простота управления и инсталляции, а так же наращивание системы без остановки функционирования существующего комплекса. Тем самым суммарная стоимость владения системой существенно снижается. Для примера: в данный момент обслуживанием существующего комплекса хранения изображений, построенного на базе Isilon, емкостью более 9 Петабайт, у компании Kodak занимается всего 6 человек. Компания Isilon имеет в своем портфолио более 1200 инсталляций по всему миру, включая совместные проекты с компаниями JibJab Media, RICE University,SONY PICTURES, FujiFilm, медцентром Cedars-Sinai, социальными сетями Facebook и MySpace и др. Первая инсталляция на территории России недавно была успешно осуществлена c участием специалистов ООО «Сторус».
Для обеспечения работоспособности интернет-ресурса AUTO.RU необходимо было решить комплексную задачу по переносу графических данных на выделенную систему хранения, обеспечить отказоустойчивость системы хранения данных, а также расширение системы по принципу кластера; построить единую систему доступа к файлам и понизить нагрузку на отдающие серверы.
При этом скорость подключения должна быть не менее 12Gb\s, скорость передачи - на мене 6Gb\s при неразмеченном начальном объеме 54TB с учетом того, что постоянный минимальный трафик составляет 400 Mb\s, при генерации запросов со скоростью 15 000 IOPS. Для решения этой задачи использовалась дисковая система хранения данных NAS ISILON IQ6000, EApp, NBD12, HWI.
О компании Isilon Systems:
Создана в 2001 году. Штаб-квартира компании расположена в г.Сиэттл (США).
Isilon - несомненный лидер рынка масштабируемых NAS-систем. Предлагаемые компанией кластеризованные системы хранения, а также решения по управлению данными гарантируют партнерам увеличение производительности для критически важных приложений, потоков и процессов, что позволяет множеству предприятий и исследовательских организаций по всему миру продуктивно обрабатывать и управлять постоянно растущими объемами данных, хранящихся в виде файлов.
www.isilon.com