Резервное копирование и восстановление данных (Back-up & Restore)
Казалось бы несколько лет назад корпорации могли позволить себе роскошь «заглушить» все серверы приложений, чтобы осуществить резервное копирование данных (back-up). Сегодня, бизнес приложения работают 24 часа в сутки. Мировая экономика диктует такие условия для выживаемости в конкурентной борьбе. Такой режим работы практически не позволяет останавливать приложения для создания резервных копий.Back-up over SAN убирает поток данных back-up из корпоративной ЛВС и пускает его через сеть хранения данных SAN. SAN back-up открывает целый мир новых методов для защиты данных. Одним из основных преимуществ SAN back-up является скорость.
Администраторы ненавидят процедуру back-up. Однако это одна из процедур, которая обязательна к исполнению. Чем быстрее она делается, тем лучше!
- Окно Back-up (Back-up Window)
- Ленточные библиотеки и типы приводов
- Политики back-up (back-up policies)
- Выбираем решение
- Привод в каждом сервере
- Back-up через ЛВС. Трафик Back-up идет через ЛВС. Выделенный сервер back-up с подключенным к нему по SCSI приводом или библиотекой
- LAN-less back-up. Трафик back-up идет через SAN. Сервер back-up и библиотека непосредственно включены в SAN.
- Raw Device Back-up с виртуальных snapshot дисков массива на ленту.
- Disk-to-Disk-to-Tape back-up
- Удаленный back-up.
- Формула для back-up
- Полезные ссылки
- Помощь консультанта
Окно Back-up (Back-up Window)
Окно Back-up – это время, выделенное для осуществления резервного копирования. Если раньше в течение этого времени все серверы приложений и рабочие станции закрывались, то теперь, во времена, когда бизнес приложения требуют круглосуточной работы, и окна фактически сводятся к нулю, производители ПО для back-up предлагают так называемые plug-in modules, которые «резидентно» работают на серверах и позволяют осуществлять back-up во время работы приложений.
Back-up в большинстве случаев все еще делается через локальную сеть (LAN). Хорошо если канал вашей сети позволяет трафикам данных и back-up успешно сосуществовать. Однако зачастую это не так и back-up в таких сетях делается в нерабочее время. Все приложения закрываются. В этом случае окном является время, пока никто не использует приложения. Но такого времени остается все меньше и меньше, так как реалии времени заставляют все больше и больше приложений работать круглосуточно или почти круглосуточно.
Если в вашей компании терабайты данных, которые нужно резервировать, вам нужно внедрить решение, которое позволяло бы это делать быстро. Возможным решением могла бы стать установка выделенной для back-up локальной сети, если конечно позволяет бюджет. Однако, в компаниях с терабайтами данных, если уже не существует, то, по крайней мере, обдумывается внедрение сети хранения данных SAN, которое практически полностью решает проблему уменьшения окна.
Ленточные библиотеки и типы приводов
Обычно внутри ленточной библиотеки располагаются несколько приводов. Рука робота вставляет и вытаскивает картриджи из приводов. Емкость библиотек компании Overland Storage предлагаемых СТОРУС, варьирует от 600GB до 1000TB.
Библиотеки могут быть размером в одиночный привод с магазином на 8 – 10 картриджей (LoaderXpress, PowerLoader), а могут вмещать до 12 приводов и до 500 картриджей (NEO). Горизонтальное масштабирование библиотеки NEO8000 позволяет нарастить объем до 1 пентабайта(!).
Библиотеки поставляются с интерфейсами SCSI, для подключения к серверам back-up и Fibre Channel или iSCSI, для непосредственного подключения в SAN.
Существует несколько технологий записи на ленту. В таблице ниже приведены основные технологии, используемые в приводах библиотек Overland.
Тип | sDLT 320 | sDLT600 | LTO-2 | AIT-3 |
Макс. Емкость (со сжатием) на кассету | 320GB | 600GB | 400GB | 260GB |
Макс. Скорость записи (без сжатия) | 57 Гб/ч | 64 Гб/ч | 102 Гб/ч | 24Гб/ч |
Наработка на отказ (часы) при 100% загрузке | 250000 | 250000 | 25000 | 400000 |
Следующий ожидаемый стандарт | --- | sDLT1200 | LTO-3 | AIT-4 |
Если вам критична скорость, используйте LTO-2. Если вам критичен объем, используйте sDLT600.
Политики back-up (back-up policies)
Вы можете использовать ряд политик для осуществления back-up. Каждая из них имеет преимущества и недостатки.
Вы можете резервировать все ваши данные все время, а можете сохранять только изменения по отношению к вашей последней резервной копии. От выбора политики зависит сколько времени займет back-up и сколько картриджей вам понадобится. Ниже приведены наиболее часто используемые политики.
Полный back-up (Full back-up). Полный back-up каждый раз резервирует все ваши данные, даже если информация не изменилась со времени последнего back-up. Вы выбираете диск, который нужно резервировать, и ПО back-up резервирует все содержимое диска на ленту или другой диск.
Инкрементный back-up (Incremental back-up). Данный тип back-up резервирует только те файлы, которые были модифицированы со времени последнего back-up. Поскольку вы делаете back-up по крайней мере каждый день, обычно небольшой процент данных меняется. Например, если только несколько файлов было изменено со времени последнего back-up, то только эти файлы запишутся на ленту.
Поскольку инкрементный back-up копирует только измененные данные со времени последнего back-up, ленты, содержащие его не могут быть использованы для полного восстановления данных. Для полного восстановления вам потребуется восстановить данные сначала с лент, содержащих полный back-up, а затем с каждой ленты, содержащей инкрементный, начиная с самой первой, после полного. Например, если полный back-up делается в пятницу, а инкрементный во все остальные дни, то для полного восстановления данных необходимо сначала взять пятничную ленту, затем понедельник, вторник и т.д.
Дифференциальный back-up (Differential back-up). Дифференциальнный back-up копирует все данные, которые изменились со времени последнего полного back-up. Этот тип back-up кумулятивный. Иными словами, каждый раз при выполнении дифференциального back-up, на ленту добавляются измененные данные со времени последнего полного. При восстановлении всех данных, вы сначала восстанавливаете с ленты, содержащей последний полный back-up, а затем с ленты, содержащей дифференциальный.
Выбираем решение
Сегодня подавляющее большинство организации осуществляют back-up на ленту. Хотя этой технологии уже более 50 лет, по всем показателям ее ожидает жизнь, по крайней мере, длиной в столько же. И причиной этому является самая низкая стоимость хранения на единицу информации. Конкурентом ленте, быстро набирающим темп, являются недорогие RAID массивы, использующие диски sATA. Однако, лента все еще остается непревзойденной технологией в средах, где требуется хранить большие объемы данных и на протяжении десятков лет.
Здесь мы попытались описать все возможные в индустрии решения по резервному копированию и восстановлению данных. Выбор за вами.
Привод в каждом сервере
Этот метод предполагает, что ленточный привод установлен внутри каждого сервера. Сервер может использовать как ПО back-up ОС сервера, так и специализированное ПО Back-up от таких поставщиков, как например, BakBone Software или Veritas. Данный метод часто используется небольшими организациями с несколькими серверами. (См. рис. 1)
Рис. 1: Ленточные приводы для осуществления Back-up устанавливаются в каждом сервере
В качестве ленточного привода сервера вы можете использовать внутренние SLR или sDLT приводы Tandberg. В качестве ПО back-up вы можете пользоваться средствами предоставляемыми ОС, либо NetVault Server компании BakBone Software.
- Достоинства: Этот метод наиболее прост и недорог.
- Недостатки: С ростом числа серверов, увеличивается кол-во внутренних приводов и время на управление процессом back-up. Проблема усугубляется с ростом объема данных на самих серверах. Ведь, сегодня максимальный объем сжатых данных на одной ленте 600 GB (sDLT600). Если объем данных сервера превышает эту цифру, то уже требуется более одной ленты для back-up на каждый сервер.
Back-up через ЛВС. Трафик Back-up идет через ЛВС. Выделенный сервер back-up с подключенным к нему по SCSI приводом или библиотекой
Этот метод наиболее часто применяется в центрах данных подразделений или компаний. К выделенному серверу для back-up по SCSI подключается ленточный привод. Это может быть как одиночный привод, автозагрузчик на 10-15 лент или роботизированная библиотека на 50 – 500 лент, в зависимости от объема данных, окна back-up, требованиям к скорости восстановления данных.
Выделенный сервер back-up управляет процессом для всех клиентов сети (для сервера back-up клиентами могут быть как серверы приложений, так и рабочие станции). Для обеспечения процедуры back-up для открытых файлов и приложений такие производители ПО как BakBone Software, поставляют специальные встраиваемые модули (plug-in modules), которые доступны практически для всех существующих сегодня ОС, баз данных и платформ.
В качестве ленточных приводов, вы можете выбрать из серий Overland, таких как:
- Автозагрузчики для рабочих групп и подразделений: LoaderExpress, PowerLoader
- Роботизированные библиотеки начального уровня: NEO 2000
- Роботизированные библиотеки уровня предприятия: NEO4000, NEO8000
- Устройство для Disk-to-Disk back-up: REO4000
Рис. 2: Выделенный сервер back-up с подключенным к нему по SCSI приводом или библиотекой
- Достоинства: Минимум людских и временных затрат на процедуру back-up. Все делается автоматически. Back-up может осуществляться 24 часа в сутки, практически в реальном масштабе времени.
- Недостатки: Трафик данных и трафик back-up идут по одной сети и при большой загрузке могут существенно снизить производительность сети в целом. Поэтому, данный метод рекомендуется использовать либо в нерабочее время, либо по отдельно выделенной сети.
LAN-less back-up. Трафик back-up идет через SAN. Серевер back-up и библиотека непосредственно включены в SAN
LAN-less back-up позволяет вам вывести трафик back-up за пределы ЛВС и пустить его через сеть хранения данных (SAN). При этом значительно улучшается производительность back-up. Для сравнения, типичная ЛВС 1000 Мбит/с (Gigabit Ethernet) перемещает данные со средней скоростью 200 Мбит/c. В SAN скорость достигает 2 Гбит/c (!).
Для того чтобы осуществить back-up через SAN, необходимо ПО back-up, которое бы “понимало» SAN. Достойным примером такого ПО может служить NetVault от компании BakBone Software. Данное ПО позволяет подключать выделенный сервер back-up, ленточную библиотеку и/или дисковый массив для disk-to-disk back-up непосредственно к коммутатору SAN (SAN switch) по средством протоколов Fibre Channel (FC) или iSCSI.
В качестве ленточных приводов c интерфейсом FC или iSCSI, вы можете выбрать из серий Overland, таких как:
- Роботизированные библиотеки начального уровня: NEO 2000
- Роботизированные библиотеки уровня предприятия: NEO4000, NEO8000
- Устройство для Disk-to-Disk back-up: REO4000
- Достоинства: Очень высокая скорость записи и восстановления данных, что позволяет осуществлять процедуру back-up с окном близким к 0 (!). Возможность использовать часть дискового пространства дисковых массивов в SAN или отдельно выделенные массивы для disk-to-disk back-up.
- Недостатки: Присутствие FC и iSCSI интерфейсов начиная с серии NEO2000, что не позволяет использовать более дешевые автозагрузчики LoaderExpress и Powerloader в данной среде.
Raw Device Back-up с виртуальных snapshot дисков массива на ленту.
Raw Device Back-up, в отличие от back-up на уровне файла, копирует информацию на физическом уровне, т.е. блок за блоком, «не заботясь» о файловой структуре диска. В сетях SAN, когда множество серверов имеют свои физические разделы (LUN) на дисковом массиве, метод Raw back-up позволяет осуществлять полный, инкрементный и дифференциальный back-up этих физических разделов без «ведома» серверов, которым они принадлежат. Однако рекомендуется это делать только в том случае, когда вы используете технологию snapshot для создания полных или/и динамических копий ваших физических разделов.
Рис 4: Raw Device Back-up c использованием Virtualization Appliance
В схеме на рис. 4 не требуется выделенный сервер, так как модуль ПО back-up NetVault Server работает непосредственно на Virtualization Appliance. NetVault “видит» snapshot копии виртуальных дисков массива как свой собственный диск и резервирует их на уровне тома при помощи функции raw device back-up. Серверы приложений при этом, «не знают» что их физические разделы на дисковом массиве подвергаются процедуре back-up. Во время back-up Virtualization Appliance «снимает» физические блоки и перемещает их на ленту. При этом необходимо, чтобы все необходимые модули, перечисленные на рис. 4 были установлении на Virtualization Appliance и snapshot клиенты на серверах приложений.
- Достоинства: Не требуется лицензий и plug-in modules на серверы приложений. Достаточно одной копии NetVault Server. При этом серверы приложений на 100% заняты приложениям. Скорость back-up значительно повышается, т.к. все данные копируются через SAN.
- Недостатки: Этот метод может быть применим только в совокупности с snapshot, т.к. применение Raw Device back-up к рабочему тому может вызвать снижение производительности дискового массива. С другой стороны, snapshot только для back-up может оказаться слишком дорогим удовольствием.
Disk-to-Disk-to-Tape back-up
Этот метод называют ступенчатым (staged или tiered). При постоянно сужающемся окне back-up, требования к скорости back-up возрастают. С другой стороны, с появлением RAID массивов с недорогими и емкими дисками sATA, появилась возможность эмуляции ленты на дисках (virtual tape). Таким образом, появился back-up на диск или disk-to-disk back-up. Скорость записи и восстановления на дисковый массив в несколько раз превышает эти параметры на ленточных приводах. Однако дисковый массив в качестве хранилища для back-up может использоваться для небольших рабочих групп и подразделений, данные которых в любом случае резервируются на корпоративную ленту.
Другим применением может служить использование дискового массива в качестве кэш для ленточной библиотеки. Например, полный back-up делается на ленту, а инкрементный на диск (рис. 5).
Рис 5. Использование ступенчатого back-up в корпоративном центре данных.
В качестве ПО для back-up на рис. 5 применяется NetVault 7.1 от BakBone. В качестве устройств для back-up применяются: дисковый массив REO4000 и ленточная библиотека NEO4000 c интерфейсом FC.
Удаленный back-up
Удаленные резервные центры данных становятся нормой, т.к. основной движущей силой является соответствующие законодательства в США и ЕС. Хотя в России и странах СНГ, подобных требований нету, все больше организаций, особенно тех, кто являются частью зарубежных компаний или плотно с ними работают, по требованию своих западных коллег такие центры внедряют. Это, прежде всего, касается правительственных, банковских и энергетических структур.
Удаленный back-up является наиболее недорогим средством защиты от катастроф, если конечно вы можете себе позволить время простоя равное времени восстановления данных. В противном случае вам лучше подумать об организации репликации или мироринга.
Рис 6. Офис 1 и Офис 2 осуществляют disk-to-disk back-up локально на дисковый массив REO4000. Затем, по расписанию, задаваемому администратором в корпоративном центре данных, данные копируются с дисковых массивов на корпоративную библиотеку NEO8000.
Формула для back-up
Если ваш back-up работает через ЛВС, старайтесь делать его в нерабочее время или же выводите его в отдельную сеть.
То же самое касается SAN. Если есть требование делать back-up в рабочее время, лучше использовать отдельное соединение. Если у вас в сервере стоит два адаптера FC, который соединяют его с дисковым массивом, поставьте третий и пустите через него back-up.
В таблице перечислены пропускные способности для данных back-up наиболее применяемых сетевых протоколов.
Сетевой протокол | Максимальна пропускная способность | Реальная пропускная способность |
100Base-T | 36Gb в час | 17Gb в час |
1000Base-T | 360Gb в час | 160Gb в час |
1Gbit FC | 360Gb в час | 280Gb в час |
2Gbit FC | 720Gb в час | 560Gb в час |
В действительности ПО back-up сжимает данные по крайней мере в двое. Поэтому, при выборе канала вы можете умножить данные таблицы на 2. Например, для того чтобы осуществить back-up данных размером 4 терабайта, вам потребуется приблизительно 4 часа используя сеть 2 Gbit FC.
Сколько приводов необходимо в библиотеке для того чтобы скопировать на нее 4 терабайта за 4 часа?
Возьмем самый быстрый на сегодня привод LTO-2. Он способен копировать 200Гб в час со сжатием 2:1. Тогда 4000 Гб мы делим на 200Гб и получаем 20 часов. Т.е. один привод LTO-2 скопирует 4 терабайта за 20 часов. Затем 20 часов мы делим на 4 часа и получаем 5 приводов. Итак, теоретически NEO4300 с тремя модулями и 5-ю приводами сделает работу. Однако в действительности, необходимо учитывать работу робота по замене лент. Поэтому рекомендуется сделать поправку на 10%. Поэтому в данном случае, необходимое число приводов будет 6.
Сколько лент мне потребуется для 4-х терабайт?
Каждая лента LTO-2 вмещает максимум 400Гб сжатых данных. Следовательно, по крайней мере потребуется 10 лент.
Следует, также помнить, что время восстановления занимает обычно в два раза больше времени резервирования, т.к. данные читаются с лент последовательно. Поэтому в средах где время восстановления критично, лучше держать back-up на дисковом массиве для моментального восстановления и одновременно на ленте для длительного хранения и в целях безопасности.
Полезные ссылки
- Девять правил резервного копирования
- Выбор правильных технологий восстановления данных
- Доступное решение резервного копирования данных disk-to-disk от СТОРУС
- Setting Up Disk-to-Disk Backup with Bakbone NetVault
- Virtual Disk Library Staging Guide
- Почему сетевые администраторы предпочитают ленточные библиотеки автозагрузчикам