Для корректного отображения этого элемента вам необходимо установить FlashPlayer и включить в браузере Java Script.
+7 (495) 775-33-76




Виртуализация: одно из важнейших направлений современной индустрии хранения данных

Введение


Слово "виртуализация" незаметно проникло в лексикон информационных технологий. Что оно означает, и насколько рекламируемые возможности соответствуют действительности?

Так как рост хранилищ данных продолжает превышать 100% в год, и в связи с увеличивающейся их разнородностью, сложность управления IT инфраструктурами возрастает экспоненциально. Виртуализация, как обещают, должна существенно улучшить управляемость процесса хранения данных. Но будучи также направленной на сдерживание затрат на информационные технологии, виртуализация пока позволяет решить только часть проблемы.

Увеличение хранилищ данных, люди, экономика, бизнес и IT бюджеты


Промышленные аналитики регулярно предсказывают 100% ежегодный прирост хранилищ данных. Для того чтобы увидеть перспективу происходящего представим, что организация, объем хранилища данных которой сейчас составляет 1 терабайт, через 5 лет должна будет обладать 32 терабайтным хранилищем. В последнее время проявилась четкая тенденция к более прагматичному подходу в отношении приобретения систем хранения данных. Прагматизм основывается на том факте, что доля расходов на хранение данных в IT бюджете возрастет в ближайшие четыре года в четыре раза, и это вызовет значительные изменения в инфраструктуре, стратегии управления хранением данных и персонале.

Первая реакция большинства администраторов на перспективу увеличения инфраструктуры хранения данных в 32 раза по сравнению с уже существующей - как я буду ей управлять с тем количеством сотрудников, которое у меня есть сейчас? Учитывая отсутствие значительного улучшения в производительности управления хранением данных, дефицит профессионалов в сфере информационных технологий во всем мире, неизменные или урезаемые бюджеты, стратегическую природу информации, как в сфере конкуренции, так и в применении приложений e-бизнеса, и необходимость одновременного улучшения доступности и масштабируемости инфраструктуры хранения данных, кажется, что администраторы не смогут найти решение во всем этом хаосе.

Во множестве переменных, которые сошлись одновременно в одной точке, присутствует элемент ночного кошмара. Мы могли бы назвать это Идеальный Шторм (Хранения данных). Десять лет назад, в 1991 году, произошло одно из редчайших метеорологических событий столетия, три различных погодных системы находились на "идеально" совпадающих встречных курсах. Штормовая система со стороны Великих Озер двигалась на восток, Канадский холодный фронт двигался на юг, а ураган Грейс - на северо-восток, а центр их встречи находился в Северной Атлантике. На своем пути шторм вздымал огромные волны, разбивал в щепки корабли и вызвал приливы на восточном побережье США. Для профессионалов в сфере IT, в 2001 году наступил такой же идеальный шторм.

Однако рост хранилищ не может быть замедлен для того, чтобы соответствовать бюджетам, или в целях экономии, или даже для того, чтобы дать возможность персоналу более комфортабельно их обслуживать. Хранилища данных - это не кран, который можно перекрыть. Рост емкости систем хранения данных обусловлен информационным потоком, который в свою очередь определяется приложениями, созданными для того, чтобы вести бизнес и поддерживать или укреплять его позиции в конкурентной борьбе. Приложения e-бизнеса - от простого управления цепочкой поставок, до менеджмента, основанного на взаимоотношениях с клиентами, и все остальные между ними, - это все новые неразрывные элементы делового мира после Интернет. Хранилища данных - это неразрывный пункт бюджета, который сейчас поглощает более 50% от стоимости установки серверов.

Новые архитектуры и технологии


Две наиболее обсуждаемые новинки последних двух лет в сфере хранения данных - это сетевое хранение данных и виртуализация.

Многие поставщики, крупные и маленькие, говорят о виртуализации хранилищ данных. Она четко позиционируется большинством из них как средство упрощения больших, сложных, гетерогенных сред хранения данных, с четким выводом, что виртуализация будет существовать в рамках сетевых (обычно SAN) сред хранения данных. Сейчас, большинство этих обещаний, кажется, создают больше вопросов, чем дают ответов. Что имеется в виду? Что виртуализируется? Где может применяться? Это виртуализация или абстракция? Может это простое объединение в пул устройств с причудливым названием? Какая часть объявленных возможностей доступна сегодня? Какие операционные системы для серверов сегодня поддерживаются? Было бы разумным рассмотреть многие обещания, но между тем существует необходимость прояснить ситуацию на виртуальном ландшафте.

Виртуализация


Robert Frances Group определяет виртуализацию как "архитектуры и продукты, спроектированные для эмуляции физического устройства, где характеристики эмулируемого устройства отображаются на другое физическое устройство". Другими словами, виртуализация разделяет то, как накопители данных представляются серверной операционной системе, и действительные физические устройства. Ни одно из этих положений не подразумевает лежащую в основе архитектуру, хотя, как было отмечено ранее, большинство обещаний в отношении виртуализации хранения данных сегодня делаются в контексте сетей хранения данных. Это не случайно, так как сетевое хранение данных и виртуализация хранения данных пытаются решить одну и ту же фундаментальную проблему - управляемость хранилищ данных. В действительности, было бы более честно сказать, что, так как сетевое хранение данных начинает применяться все шире, то нам надо сделать что-то еще, чтобы упростить тяжкую ношу управления хранением данных.

Масштаб проблемы так велик, что цель всех усилий, окружающих хранение данных и управляемость этого процесса, должна заключаться в исключении вмешательства человека в процесс управления хранилищами данных. Виртуализация - это шаг в этом направлении, и мы верим, что автоматические алгоритмы управления и разумные системы принятия решений войдут в виртуализацию в ближайшем будущем.

Виртуализация, применяемая в контексте SAN, вносит различные элементы в задачу упрощения управления хранением данных. Она скрывает сложность систем, упрощая образ имеющихся устройств для сервера. Она маскирует изменения, позволяя удалять физические устройства хранения данных, модернизировать или заменять, без необходимости сообщения операционной системе через драйверы устройств или другим способом, что область хранения изменилась. Она может увеличивать продуктивность работы администратора благодаря объединению в пул множества устройств хранения данных, и возможности распределения полученного пространства между многими серверами через графический интерфейс пользователя (GUI) или сходный. Она может агрегировать множество маленьких накопителей в один большой диск. И она может снизить стоимость владения как минимум двумя способами:
  • позволяя агрегации компонентов хранения данных присутствовать как единое целое;
  • устраняя недостаточно эффективное использование имеющейся емкости.
Можно было бы поспорить, что некоторые из этих вещей не совсем виртуализация, а абстракция или эмуляция, или агрегация. Однако вопрос заключается не в семантическом споре, а в стимуляции критического взгляда на предлагаемые возможности виртуализации, чтобы можно было сделать разумный выбор.

Поэтому:
  • Цель виртуализации хранения данных - обеспечить лучшее управление и консолидацию ресурсов хранилищ.
  • Виртуализация может применяться во множестве точек на всем непрерывном пространстве между приложениями и данными.
  • Ради упрощения обозначим, что эти точки - хост, сеть и устройство хранения данных.
  • Каждая точка применения может предоставлять преимущества, уникальные именно для этой точки, и некоторые вещи лучше реализуются в соответствующих точках.

"Что" и "где" - за и против


Пытаясь понять и дифференцировать многочисленные применения виртуализации хранения данных, давайте начнем с того, что обозначим элементы, которые виртуализируются, как "что", а место проведения виртуализации, как "где" или реализацию. Так как основной целью виртуализации хранения данных является улучшение управления ресурсами хранилищ, то "что" - это обычно лента и/или диск.

Подавляющее большинство современных архитектур виртуализации хранения данных от различных поставщиков спроектированы для применения в контексте сети хранения данных, поэтому "где" - это сервер, сеть или устройство хранения данных.

В дополнение к "что" и "где" существует еще один элемент виртуализации. Он называется "зона ответственности". Например, если программное обеспечение для виртуализации применяется на сервере, то логическое или виртуальное хранилище данных представлено на нем, хотя оно соответствует хранилищу, существующему вне сервера. Таким образом, зона ответственности простирается за пределы платформы, где применена виртуализация.

Есть показатель предсказуемости в применении виртуализации в зависимости внутренней компетенции поставщика. Например, желательно, чтобы поставщик сервера, внедрял виртуализацию хранения данных на уровне сервера. Также желательно, чтобы поставщик программного обеспечения внедрял виртуализацию на серверной платформе. Обычно, при таком применении, службы виртуализации представления хранилища располагаются на сервере, но отображают внешнее хранилище данных. Здесь нет другого контроля над внешними хранилищами, кроме их распределения.

В пределах "сервероцентрического" подхода к виртуализации существует благоприятная возможность прозрачного использования многочисленных характеристик производительности и стоимости многоуровневой иерархии хранилищ. Действительно, промышленность заигрывала с этой концепцией многие годы, но многократно отказывалась от нее, как от слишком сложной, и требующей много труда для внедрения. Что если бы виртуализация иерархии хранилищ была объединена со стратегией служб для того, чтобы скрыть существование иерархии хранилищ от требовательных к хранилищам приложений? Эта возможность могла бы быть также применена в виде схемы виртуализации, в центре которой находится сеть.

Вот несколько вопросов, касающихся применения виртуализации на сервере, которые надо задать поставщику:
  • Надо ли устанавливать программное обеспечение на каждый сервер, участвующий в сети хранения данных?
  • Влияет ли пропускная способность средств ввода-вывода сервера на эффективность виртуализации и производительность операций ввода-вывода?
  • Существует ли максимальная емкость хранилищ, поддерживаемая в это сети хранения? Если да, то какая?
  • Какие поддерживаются типы устройств хранения данных?
  • Могут ли использоваться устройства хранения данных различных поставщиков?
  • Какие поддерживаются приложения резервного копирования?
  • Доступны или планируются какие-либо возможности стратегического управления?
  • Будет ли это решение поддерживать внесерверное резервирование и/или миграцию?
  • Совместим ли он или может взаимодействовать с иными методами виртуализации?
Поставщики сетей не обязательно должны внедрять виртуализацию на сетевых устройствах, но это желательно. Под сетевым устройством в данном случае понимается разновидности менеджеров области хранения данных, или интеллектуальный маршрутизатор, или интеллектуальный коммутатор с платформой, способной осуществлять виртуализацию хранения данных. Службы представления работают в сети, а логические устройства соответствуют внешним устройствам хранения. Здесь опять нет другого контроля над внешними хранилищами, кроме их распределения.

Во многих случаях, сеть - это наиболее логичное место для внедрения виртуализации хранения данных. Это ни сервер и ни устройство хранения данных, и поэтому, существуя между этими двумя средами, оно может быть наиболее "открытым" вариантом применения виртуализации. Такое применение виртуализации хранения данных наиболее приемлемо для поддержки любого сервера, любой операционной системы, любого приложения, любого типа устройств хранения от любого их поставщика.

Может быть самой основательной причиной локализации виртуализации хранения данных в сети является то, что она смогла бы существовать в пределах естественного пути данных во время любых действий, связанных с операциями ввода-вывода.

Кроме того, "видение" всех устройств хранения и типов устройств является практической базой для интеллектуального стратегического управления.

Вопросы, которые следует задавать поставщикам, внедряющим виртуализацию на уровне сети:
  • Какие серверы, операционные системы и приложения поддерживаются на уровне сервера?
  • Какие поддерживаются типы устройств хранения данных?
  • Могут ли использоваться устройства хранения данных различных поставщиков?
  • Какие существуют ограничения пропускной способности средств ввода-вывода?
  • Существует ли максимальная емкость хранилищ, поддерживаемая в это сети хранения? Если да, то какая?
  • Будет ли это решение поддерживать внесерверное резервирование и/или миграцию?
Третья альтернатива "где" - это внедрение виртуализации непосредственно в хранилищах данных. Это очень интересный вариант. Если виртуализация осуществляется на этом уровне, и поставщик является поставщиком хранилища данных, то возникает несколько проблем, связанных с тем, как избежать ограничения устройств хранения только теми, которые продает поставщик. Поставщик хранилищ, осуществляющий виртуализацию хранения данных, должен сформировать стратегический альянс с поставщиком серверов, поставщиком программного обеспечения, или поставщиком сети для того, чтобы избежать создания собственной закрытой системы. Но главное, что придает этому варианту внедрения интерес, это не "что" и даже не "где", а "область ответственности".

Когда виртуализация хранения данных внедряется на уровне устройств, существует благоприятная возможность совмещения логической (виртуальной) среды и физических устройств в пределах одной "зоны ответственности". Использование этой зоны ответственности, означающее административное управление, как службами логического представления, так и физическими ресурсами, необходимыми для удовлетворения потребности в хранилищах данных, могло бы привести к увеличению эффективности эксплуатации и использования имеющейся емкости. Это невозможно для тех случаев применений виртуализации, когда физические устройства хранения являются внешними, по отношению к зоне ответственности машин виртуализации.

В действительности, существуют два типа применения виртуализации на уровне устройств, когда логические и физические устройства существуют пределах зоны ответственности машины виртуализации. Это - виртуальный диск и виртуальная лента. Преимущества, проявляющие в том случае, когда зона ответственности включает в себя и логические (виртуальные) и физические устройства, проявляются в очень высокой эффективности использования емкости в случае виртуального диска, и очень высокой эффективности использования ресурсов ленточного носителя в случае виртуальной ленты.

Продолжающееся плохое использование ресурсов хранилищ в современных дисковых средах уровня предприятия связано с неэффективными накладными расходами, связанными с использованием старых и новых технологий. Обычно, только 80% емкости действительно распределено под файлы и базы данных. Это означает, что 20% емкости никогда не будет распределено или зарезервировано под факторы роста. Еще 30% емкости, в дополнение к уже потерянным 20%, теряется из-за того, что она распределена под файлы, которые никогда не вырастут в объеме настолько, чтобы заполнить ее. Это означает, что около 40-50% доступного дискового пространства возможно никогда не будет использовано.

Моментальные копии, используемые многими поставщиками аппаратного и программного обеспечения для уменьшения времени восстановления в случае потери данных могут увеличить в два раза емкость, требуемую приложением. Развитие приложений ставит перед организациями, связанными с информационными технологиями, проблему проверки объемов, занимаемых всеми файлами и базами данных.

Плохая утилизация емкости и возрастающий объем накладных расходов выливаются в увеличение стоимости инфраструктуры, которая может быть снижена путем внедрения виртуализации на уровне устройств и увеличения зоны ответственности, которая включает логические и физические устройства.

В области ленточных технологий виртуализация внедряется главным образом для улучшения эффективности использования емкости картриджей, которые сейчас могут стоить около 100$. Непредвиденно большие преимущества виртуализации лент проявляются также в увеличении производительности приложений, и возможности достичь 100% автоматизации благодаря применению библиотек и накопителей для автоматизации картриджей, которые еще совсем недавно переставлялись вручную. Этот новый фактор сам по себе оправдывает использование виртуальных лент в UNIX и NT.

Вопросы, которые следует задавать поставщикам, внедряющим виртуализацию на уровне устройств хранения данных:
  • Будет ли это решение поддерживать устройства хранения данных других поставщиков?
  • Существуют ли ограничения пропускной способности средств ввода-вывода?
  • Существуют ли ограничения пропускной способности процессора?
  • Какие поддерживаются серверные платформы и операционные системы?
  • Какая емкость хранилища поддерживается?
  • Могут ли многочисленные подсистемы общаться друг с другом или совместно использовать ресурсы?
  • Увеличивается ли до максимума утилизация емкости?
  • Как обеспечивается доступность?
  • Существуют ли какие-либо функции управления хранилищами, выполняемые машиной виртуализации? Если да, то какие?

Резюме


В настоящей статье были обсуждены три области, где может быть осуществлена виртуализация - сервер, сеть или устройство, подразумевая, что большинство случаев применения виртуализации связаны с упрощением управления большими инфраструктурами хранения данных, совместно используемыми многочисленными разнородными серверами и приложениями. Представление логического образа устройств хранения данных для серверов, отличающееся от физической реальности, может дать эффект скрытия сложности структуры, маскирования изменений и увеличения производительности труда. Что отсутствует в большинстве применений виртуализации так это способ сокращения размеров инфраструктуры хранения данных, необходимой для удовлетворения потребностей приложений в хранилищах. Да, управляемость - это серьезный вопрос, требующий решения. Но стоимость инфраструктуры - тоже проблема.

Пользователям следует внимательно проверять утверждения поставщиков относительно их продуктов виртуализации хранения данных. Что сегодня доступно? Насколько эти продукты открыты? Присутствуют или планируются стратегическое управление и интеллектуальная система? Является ли целью снижение стоимости инфраструктуры?

Виртуализация хранения данных необходима для того, чтобы обойти некоторые ограничения по взаимодействию при сетевом хранении данных, также как и для того, чтобы предоставить два огромных и своевременных преимущества организациям в сфере информационных технологий:
  • Значительно улучшить управляемость хранения данных
  • Значительно уменьшить стоимость инфраструктуры хранения данных

Первое преимущество - это цель всех архитектур и применений виртуализации. Однако, второе может быть получено только в двух случаях:
  • если виртуализация применяется на уровне устройств, и если машина виртуализации спроектирована для использования факта, что логические и физические устройства существуют в пределах единой зоны ответственности, и таким образом оптимизирует использование физической емкости.
  • и/или в случае, если виртуализация применяется таким образом, чтобы обеспечить прозрачное использование стоимостных преимуществ стратегически управляемой многоуровневой иерархии хранения данных.
Виртуализация хранения данных - это важное усовершенствование. Прямо сейчас рассмотрите обещания поставщика с некоторой долей скептицизма, пока выполняемые функции и путь дальнейшего развития понятны.

Источник: SearchStorage http://searchstorage.techtarget.com/


© Copyright "СТОРУС" 2003 - 2017