Виртуализация хранилищ данных. Часть 3.
Часть 1 | Часть 2 | Часть 3 | Часть 4
Продолжение серии статей, посвященных описанию сущности виртуализации, ее преимуществ для бизнеса, архитектуре виртуализации, а также представлению некоторых решений, в частности решения от Chaparral/FalconStor.
Выбор решения виртуализации
Дикий, дикий мир SAN и NAS
В ответ на необходимость хранения и управления постоянно растущими ‘джунглями’ критически важной информации, многие компании либо уже внедрили сеть SAN (Storage Area Network), либо рассматривают такую возможность. Предостережение: типичному решению SAN присуща высокая степень сложности внедрения и последующей его поддержки. Для этого существует множество различных причин. Необходимо помнить, что хотя базовые устройства хранения данных и становятся дешевле, сложность остается дорогостоящей.
Еще одной проблемой при конструировании сети хранения является существование NAS (Network Attached Storage) в качестве альтернативного способа хранения. Что выберет компания - SAN или NAS? Или и то, и другое? Каждая из систем отвечает на различные потребности и применяет различный подход к управлению хранением. И хотя преимущества и недостатки SAN и NAS все еще активно осуждаются в технологических кругах и различными производителями, факт остается фактом – для центров данных нужны обе системы.
Еще более усложняет ситуацию то, что первоначальное разделение способностей SAN и NAS, например, уровень доступа на уровне блока или на уровне файла соответственно, постепенно размывается по мере того, как возможности систем хранения данных увеличиваются и совершенствуются. В результате, компания может инвестировать огромные средства в одно решение, только для того, чтобы впоследствии обнаружить, что другое решение могло бы быть намного лучше по некоторым характеристикам, например, быть более универсальным. Но только будет уже поздно: средства уже потрачены... Более того, выбранное решение, скорее всего, будет невозможно интегрировать с любым другим решением. Таким образом, компания может загнать себя в зависимость от патентованного решения одного производителя - решения, которое может меньше подходить потребностям компании, быть менее технологически совершенным и более дорогим, чем альтернативные решения. Либо же компания получит несколько разных решений хранения, которыми нужно управлять по отдельности, что будет отнимать у администраторов хранилищ данных дополнительное время (хотя его и так немного) и потребует от IT персонала непосредственного опыта и знаний о нескольких различных устройствах и способах соединения.
Одно можно сказать с уверенностью: решения хранения SAN и NAS обычно дорогостоящи и сложны в проектировании, внедрении и интеграции. В дополнение к данным факторам, нужно отметить, что после внедрения решений требуются постоянные и весьма существенные инвестиции в их поддержание. Это объясняется тем, что каждое особое решение производителя требует специализированных технических навыков для его управления, а будущее расширение подразумевают покупку все тех же патентованных устройств хранения и использование все тех же способов соединения, несмотря на то, что на рынке уже появились новые альтернативные способы. Существование этих факторов породило огромный спрос на такой метод управления множеством хранилищ, который не только обладал бы унифицирующим и упрощающим эффектом на управление хранением, но и также был бы более экономичным в долгосрочной перспективе.
Еще один достойный упоминания фактор: слияния, приобретения и партнерства, распространенные в современном мире, отображают динамическую природу бизнеса. Для успеха таких деловых операций очень важной является способность быстро начать и постоянно поддерживать быстрое совместное использование данных, зачастую через корпоративные компьютерные сети национального или международного масштаба. Идея одного острова хранения, доступного только для индивидуальных, географически отделенных подразделений, уже практически исчезла на фоне эволюции сред электронного бизнеса (eBusiness). Поэтому обязательным условием является то, что несмотря все полезные характеристики, которыми может обладать решение хранения, его функционирование не должно замедлять или каким-либо иным образом препятствовать совместному использованию данных. На самом деле, решение, которое ускоряет консолидацию и движение данных, определенно находится на первом месте в списке пожеланий компании.
Проще значит дешевле. Каким образом можно упростить и ускорить инициализацию хранения и доступ к данным, и, одновременно, снизить издержки? Подсказка: именно здесь в игру вступает виртуализация, как уже подробно было описано в предыдущих статьях данной серии. Необходимо использовать такое решение виртуализации, которое способно объединить инициализацию и управление SAN и NAS под одним началом – простым и понятным во внедрении и использовании. Особенно важным является реализация такого решения, которое обеспечивает все преимущества виртуализации, в то же время снижая административные издержки, вместо того, чтобы вводить новые политики, процедуры или модные (читай дорогие) устройства.
Критерии выбора решения виртуализации
Виртуализация явилась ответом на пожелания всех и каждого. Но что хорошего от ее функциональных возможностей, если она не поставляется совместно с комплексным высокопроизводительным пакетом? Не особенно много.
Недостаточно просто запустить процесс виртуализации. Ее истинная ценность может быть реализована только совместно с перспективным решением хранения данных, оснащенным множеством характеристик, которое использует существующую IT инфраструктуру и обеспечивает не просто виртуализацию, но наивысшую производительность (быстрое хранение и доступ к данным), простоту использования, унифицированное управление SAN и NAS, виртуализацию между файл-кабинетами (cabinet), а не только внутри одного файл-кабинета, а также поддержку гетерогенных сред хранения. Достичь подобного можно только благодаря решению, которое предлагает абсолютную свободу выбора устройств любых производителей, свободу выбора любых интерфейсов, соединений, платформ и протоколов.
Совет: если какое-либо решение не может использовать существующую в компанию сетевую инфраструктуру и знания IT персонала, не обеспечивает свободную интеграцию гетерогенной среды хранения и не имеет способности инициализировать ресурсы хранения SAN и/или NAS, лучше обратить внимание на что-нибудь другое.
Самое важное – это найти такое решение, которое обеспечивает виртуализацию внутри унифицированного механизма, при этом одновременно увеличивая скорость совместного использования (разделения) хранимых данных и максимизируя окупаемость капиталовложений (ROI) в текущие и будущие инфраструктурные элементы. В этом отношении не все решения хранения одинаковы. Рынок хранения данных гарантирует интеллектуальные, высокопроизводительные, нейтральные по отношению к производителю решения, которые работают со всеми инструментами управления, системами отчета и операциями технического обслуживания и поддержки.
Критерии выбора решения виртуализации должны включать производительность, масштабируемость, высокую доступность, а также стоимость установки и обслуживания. Также следует уделить внимание простоте использования и планам производителя или поставщика на будущее (например, их намерение поддерживать новые стандарты). Решения, которые не позволяют ответственным за IT в будущем делать более экономичные и недорогие закупки, либо ограничивают их выбор одной запатентованной технологией, накладывают в перспективе большие издержки. Как раз этого и следует избегать на современном, мгновенно меняющемся рынке.
Перед выбором решения следует задать следующие вопросы: потребует ли аппаратно-программное решение всестороннего матричного тестирования всего оборудования? В случае с аппаратными средствами (оборудованием), какая поддержка существует для них в отрасли? Требует ли оборудование отдельных устройств ("black box"), основанных на запатентованной, специфической для производителя операционной системе?
Настоящей проблемой при подборе критериев выбора решения является определение специфических бизнес требований предприятия. Необходимо определить такие факторы как пропускная способность, время отклика и требуемые физические соединения. Имеющийся IT персонал для поддержки решения и его технические знания также играют важную роль.
В то время как многие компании пытаются освободиться от патентованных, характерных для определенного производителя сред, многие IT профессионалы приходят к осознанию того факта, что настоящее решение виртуализации обеспечивает распознавание и контроль за многими устройствами хранения различных производителей.
При выборе решения виртуализации, компании должны выбирать такое решение, которое приносит организации наибольшую ценность. К сожалению, это не всегда очевидно. Решения виртуализации, представленные сегодня на рынке, практически исключительно сосредотачиваются на том, чтобы представить хост-серверам множество физических устройств в виде логических виртуальных томов. Но не стоит забывать и о еще двух аспектах, которые создают действительно полное решение: связность и оптимизация приложений. Как уже упоминалось ранее, свобода соединений позволяет беспроблемно интегрировать устройства хранения и расширять сеть хранения. Оптимизация приложений позволяет снять с хост-сервера такие задачи, как ‘мгновенные снимки’ (snapshot) и резервное копирование, что значительно увеличивает скорость передачи данных.
Ранее предполагалось, что виртуализация будет работать только в Fibre Channel SAN. Современные же бизнес требования диктуют, чтобы хранилища были динамически доступны не только внутри сети SAN, но и за ее пределами. Завершенное решение виртуализации также должно иметь возможность подключать виртуализованные тома через IP. Кроме того, решение должно позволять легкую интеграцию и управление NAS устройствами. Именно последнее является для многих существующих на рынке решений важной разделительной линией: они предоставляют возможности виртуализации только внутри сети SAN и не принимают NAS устройств. Это опровергает один из наиболее важных аспектов виртуализации хранения – представление хранилищ и данных вне сети SAN.
ОСНОВЫ АРХИТЕКТУРЫ ВИРТУАЛИЗАЦИИ ХРАНИЛИЩ
Было бы полезно представить два метода организации виртуализации хранения: внеполосная (out-of-band) (ассиметричная) виртуализация и внутриполосная (in-band) (симметричная) виртуализация. Статья не ставит своей целью детально описать архитектуру каждого подхода и предлагает лишь основные моменты, чтобы читатель мог понять, как делать различия между преставлениями виртуализации от различных производителей. Каждая из архитектур имеет свои особенные преимущества и недостатки, поэтому важно остановиться на описании каждой из них.
Внеполосная (out-of-band) или ассиметричная виртуализация достигается благодаря контроллеру, который размещается вне пути данных (data path), либо “на стороне” (on the side). Этот контроллер обслуживает метаданные для компонента на основе хоста, которым, как правило, является интеллектуальный адаптер шины узла (HBA) либо драйвер устройства, который использует метаданные для передачи I/O напрямую на данное устройство хранения. Контроллер метаданных фактически действует как поставщик информации о размещении данных (mapping) между хостом и устройством хранения.
Внеполосная модель делает попытку ответить на проблемы производительности и масштабируемости благодаря автоматическому (hands-off) подходу, в котором конечные точки (end-points) свободно осуществляют коммуникацию друг с другом. Однако в данной модели новый узел может привнести риск для безопасности системы, поскольку не существует никакой встроенной безопасности, кроме превентивного (профилактического) управления сетью с зонированием и LUN masking.
Внутриполосная (in-band) или симметричная виртуализация основана на центральном хост-сервере, который становится исполнителем всех операций ввода/вывода (I/O) серверов приложений. Этот центральный сервер объединяет доступные ресурсы локально подключенных устройств хранения SAN или NAS и затем представляет, управляет и разделяет хранение для серверов приложений в виде виртуальных томов. Центральный сервер отвечает за повторную выдачу I/O запросов от серверов приложений к соответствующим устройствам хранения, к которым администратор хранения назначил их ранее.
Хотя внутриполосной подход может быть легче в применении, основной проблемой является масштабируемость. Поскольку устройство находится посередине пути данных (data path), передача данных ввода/вывода ограничивается пропускной способностью ввода/вывода и вычислительной мощностью (возможностями по обработке данных) этого устройства. Логически, из этого вытекает опасение, что данное устройство может стать точкой сбоя или узким местом сети. Посему усовершенствованный внутриполосной подход обладает характеристиками и мерами безопасности, которые помогают снять вышеназванные проблемы.