Об основных задачах и технологиях резервного копирования

Тезис о том, что данные становятся наиболее критичным для бизнеса активом из некогда дискуссионного давно превратился в аксиому. Аналитики прогнозируют рост данных в современных ИТ-системах в десятки раз уже в ближайшие десять лет, что дает мощный стимул развитию систем хранения данных. Однако, проблема аккумулирования все нарастающих потоков информации, сопровождается еще и проблемой ее возможной потери в процессе накопления и использования.

Многолетняя практика исследований и внедрений в сфере резервного копирования данных сформировала ряд устоявшихся архитектурных подходов к построению таких систем с использованием экономичных, но сравнительно медленных ленточных накопителей, быстрых дисковых систем и комбинированных решения с использованием как дисковых, так и ленточных накопителей.

Резервное копирование на ленту — классический подход

На протяжении нескольких десятилетий основой систем резервного копирования были ленточные накопители, поскольку в расчете на единицу емкости лента существенно дешевле жестких дисков. Поскольку при резервном копировании через локальную сеть на ленточный привод или ленточную библиотеку передаются большие объемы данных, хранящихся на дисковых массивах и дисках серверов, обычно ее проводят после окончания рабочего дня, чтобы эта операция не мешала работе пользователей в сети. Системный администратор вечером вставляет картриджи в ленточную систему и запускает программу резервного копирования, а на следующий день утром вынимает картриджи, на которых записаны резервные копии. Однако при больших объемах данных за ночную смену можно не успеть записать все резервные копии, поэтому во многих компаниях полное резервное копирование выполняется в выходные (т. е. запускается вечером в пятницу), а в остальные рабочие дни выполняется так называемое инкрементальное резервное копирование (в понедельник на ленту записываются только те данные, которые изменились со времени последнего полного резервного копирования, во вторник — данные, которые изменились после предыдущего инкрементального копирования в понедельник и т. д), либо дифференциальное резервное копирование, когда в рабочие дни на ленту записываются данные, которые были изменены со времени последнего полного резервного копирования. Часто системный администратор маркирует картриджи по дням недели, в которые их нужно вставить в привод.

Основные недостатки такого подхода к организации резервного копирования — низкая скорость не только записи копий на ленту, но и их извлечения для восстановления данных. Дело в том, что в отличие от жестких дисков лента — это запоминающее устройство с последовательным доступом к данным, и хотя в режиме, когда данные идут сплошным потоком, скорость записи на ленту мало отличается от скорости жестких дисков, при записи небольших файлов и особенно при их считывании быстродействие ленты существенно падает из-за того, что определенное время уходит на перемотку ленты. Время восстановления с ленты дополнительно увеличивается, когда помимо полной резервной копии нужно считать еще и последние инкрементальные копии или хотя бы одну дифференциальную. В результате восстановление с ленты содержимого дисков вышедшего из строя сервера может занять несколько часов, а то и дней, и приложения, которые работали на этом сервере, будут длительное время неработоспособны. Многочасовое окно резервного копирования совершенно не подходит для защиты данных приложений, работающих в круглосуточном режиме, поскольку для корректного резервного копирования их БД работа самого приложения должна быть приостановлена.

Диски SATA сделали реальностью резервное копирование D2D

С начала прошлого десятилетия, когда для дисковых массивов стали доступны относительно дешевые жесткие диски SATA, началось широкое использование резервного копирования по схеме «с диска на диск» (disk-to-disk, D2D). Стоит отметить, что еще до выхода на рынок систем D2D компания NetApp, а вслед за ней и другие производители дисковых массивов реализовали функцию «мгновенных снимков» данных (snapshots), по которым можно делать резервные копии без приостановки приложений, работающих с этими данными. Кроме того, эти «мгновенные снимки» позволяют быстро восстановить старые данные без использования резервных копий, однако для их хранения требуется дополнительная емкость жестких дисков массива.

Применение жестких дисков в качестве носителей резервных копий существенно улучшило скорость резервного копирования и восстановления данных и позволило избавиться от сложного механизма создания инкрементальных и дифференциальных резервных копий и восстановления с них. Кроме того, когда резервные копии хранятся на жестких дисках, можно легко и быстро проверить, правильно ли записалась резервная копия особо важных данных (при использовании ленты для такой проверки требуется считать всю резервную копию, поэтому такая операция может растянуться на несколько часов). Потребность в ускорении резервного копирования и применении новых механизмов обострилась в связи с массовым внедрением серверной виртуализации, поскольку для бесперебойной работы виртуализированных приложений нужно обеспечить быстрое восстановление образа виртуальной машины.

Тем не менее стоимость хранения одного гигабайта на ленте остается существенно ниже, чем на жестких дисках SATA, поэтому производители систем резервного копирования D2D особые надежды связывают с технологией дедупликации, позволяющей уменьшить емкость жестких дисков, которая нужна для хранения резервных копий. Эта технология анализирует резервные копии, пересылаемые для хранения, и ищет среди них идентичные наборы данных. Для таких дубликатов резервных копий на диск записывается только указатель на первую копию, что позволяет на порядок (и даже больше) уменьшить общий размер резервных копий. Если дедупликация выполняется на стороне того дискового массива или сервера, на котором хранятся оригиналы данных, она также уменьшает объем данных, пересылаемых при резервном копировании через сеть на систему D2D. В результате копирование происходит быстрее и меньше «грузит» локальную сеть. Оборотной стороной резервного копирования с использованием дедупликации является необходимость в дополнительных процессорных мощностях для анализа резервных копий, а если дедупликация происходит на стороне системы, то требуется и дополнительная емкость для временного хранения обрабатываемых резервных копий.

D2D2T — комбинация резервного копирования на жесткие диски и ленты

Большинство компаний, предлагающих решения D2D, предсказывают, что рано или поздно жесткие диски полностью вытеснят ленту из систем резервного копирования (исключение составляют такие вендоры, как HP и IBM, которые помимо систем D2D продолжают поставлять и традиционные ленточные библиотеки).

Тем не менее, как показывает практика, в современных инфраструктурах резервного копирования лента может сосуществовать с системами D2D: именно так происходит при использовании схемы D2D2T (Disk-to-Disk-to-Tape). Архитектура D2D2T предусматривает, что на дисковой системе резервного копирования хранятся только последние резервные копии (например, за последний месяц), а по мере их устаревания они переносятся на ленту. Такой подход обеспечивает быстрое резервное копирование и восстановление данных и низкую стоимость хранения, поскольку основной объем резервных копий хранится на относительно дешевых лентах. Кроме того, медленная запись старых резервных копий на ленту выполняется в офлайн-режиме и поэтому никаким образом не влияет на работу продукционных приложений.

Софт имеет значение

Программное обеспечение систем резервного копирования за последнее десятилетие также проделало большую эволюцию, и его функциональность существенно расширилась. Предназначенные для сетевого резервного копирования пакеты обычно состоят из двух компонентов — серверной части, которая инсталлируется на отдельный компьютер и управляет всеми процессами копирования и восстановления данных, и клиентской, инсталлируемой на серверах, ПК и дисковых массивах, содержимое дисков которых требуется защитить.

Если в начале прошлого десятилетия основными функциями ПО резервного копирования была автоматизация записи и восстановления резервных копий с помощью ленточных систем, например, операций создания инкрементальных и дифференциальных копий и управление ленточными картриджами, содержащими резервные копии, то теперь все пакеты резервного копирования полностью поддерживают использование жестких дисков в качестве носителя резервных копий, а многие — и резервное копирование по схеме D2D2T, а также используют специальные опции для защиты данных компьютеров мобильных пользователей. Кроме того, за последние пару лет почти все программные решения этого класса стали поддерживать дедупликацию резервных копий и резервное копирование виртуальных машин. Наконец, стоит упомянуть о появлении специализированных пакетов для резервного копирования виртуальных машин.

Новые вызовы

Развитие ИТ-технологий с одной стороны позволяет все более эффективно решать задачи резервного копирования, а с другой — постоянно «обновляет» список проблем. Например, всвязи с развитием концепции мобильного офиса, обозначилась еще одна серьезная проблема резервного копирования, усиливающаяся в последнее время — это обеспечение защиты данных, которые хранятся на ноутбуках, планшетах, смартфонах мобильных пользователей. Поскольку эти устройства не всегда подключены к корпоративной сети, либо подключены к ней по медленным каналам, поэтому традиционное резервное копирование через сеть для них применить нельзя.

Резервное копирование и восстановление широко популярных сегодня виртуальных серверов создает дополнительные проблемы как из-за роста объемов данных, так и из-за необходимости восстановления виртуальной машины за считанные минуты.

Лев Левин, обозреватель PCWeek RE, внештатный эксперт «Бестселлеров IT-рынка»

Полная электронная версия этой статьи доступна только для подписчиков. Для получения полной электронной версии статьи сейчас

Полная электронная версия этой статьи доступна только для подписчиков. Для получения полной электронной версии статьи сейчас Вы можете оформить запрос.