Современные решения SDS

Лев Левин

Прошло больше двух лет с нашего предыдущего обзора решений для программно-определяемого хранения (Software Defined Storage, SDS). За это время популярность и востребованность SDS существенно выросла. Например, по оценкам аналитического агентства IDC, в 2015 г. объем рынка SDS составлял 4,58 млрд долл. и к 2019 г. он, согласно прогнозу, вырастет до 9,09 млрд долл., т. е. каждый год будет увеличиваться более чем на 20%. При этом продажи программного обеспечения для реализации SDS увеличатся с 700 млн долл. в 2106 г. до 4,8 млрд долл. в 2019 г. Прежде чем обсуждать факторы, стимулирующие переход ИТ-индустрии на применение SDS, напомним читателям основные отличия программно-определяемых систем хранения от традиционных СХД.

IDC определяет SDS как любой стек программ для реализации функционала хранения данных, который может работать на серверах стандартной архитектуры с процессорами Intel x86. Такой программный стек должен, независимо от оборудования, с помощью виртуализации дисковых ресурсов и объединения внутренних дисков серверов в единый виртуальный пул емкости обеспечивать полный набор сервисов хранения (включая дедупликацию, репликацию, thin provisioning и мгновенные снимки). В традиционных системах хранения наиболее продвинутые функции обычно реализуются с помощью специализированных микросхем, например, в дисковом массиве Hitachi VSP в основе архитектуры лежит crossbar-коммутатор Hi-Star.
Главное преимущество SDS по сравнению с традиционными дисковыми массивами корпоративного класса – это реализация на основе стандартных аппаратных средств всего функционала СХД на уровне программного обеспечения. Это позволяет избавиться от применения дорогого специализированного оборудования, внедрять новый функционал хранения без значительных инвестиций в разработку и производство заказных микросхем. Кроме того, SDS обеспечивает более высокую независимость от производителей оборудования для систем хранения, а также дает возможность применять новинки в аппаратной части (например, процессоры, модули флэш-памяти и сетевые интерконнекты) сразу же после того, как Intel и другие производители компьютерных компонентов начнут поддерживать их в своих серверных платформах.

Стимулами для применения SDS является стремление корпоративных заказчиков снизить затраты на внедрение новых СХД, использование облачных технологий, для которых традиционные дисковые массивы плохо подходят либо слишком дороги по удельной стоимости хранения (в расчете на один терабайт). Кроме того, за последние два года интерес к SDS подогревается широким внедрением гиперконвергентных приставок – отдельного класса интегрированных систем для быстрого внедрения виртуализации серверных приложений. В них, в отличие от конвергированных систем, вместо отдельного дискового массива для хранения корпоративных данных используются внутренние диски серверов либо напрямую подключаемые к серверам дисковые полки. При этом весь функционал хранения данных реализуется с помощью пакета SDS, который инсталлируется на тех же серверах, на которых работает и ПО виртуализации. Такой подход позволяет добиться значительной экономии затрат на хранении при внедрении виртуализации, поскольку владельцу гиперконвергентной приставки не нужно покупать отдельную СХД.

Кроме того, SDS могут применяться для построения горизонтально-масштабируемой платформы хранения для облачных вычислений с низкой стоимостью одного гигабайта, а также как более экономичная замена традиционных СХД, использующих специализированные микросхемы. Еще одна сфера применения программно-аппаратных СХД – это специализированные приставки резервного копирования (PBBA), в которых с помощью программного обеспечения SDS организовано хранение резервных копий на внутренних дисках сервера. Подобные решения в настоящее время предлагают Dell и EMC HPE.

Большинство решений SDS обеспечивают горизонтальное масштабирование емкости и производительности программно-определяемой СХД добавлением к ней узлов (серверов), объединяемых в кластер. Правда, в SDS компании Nexenta система не расширяется более чем до двух узлов, здесь масштабирование емкости обеспечивается за счет файловой системы ZFS.

Самым важным событием в секторе SDS за прошедшие два года стал выпуск VSAN 6.2 - существенно усовершенствованной версии пакета Virtual SAN компании VMware, лидера технологий виртуализации. Во VSAN 6.2 реализованы снижающие стоимость хранения функции дедупликации и сжатия данных, что особенно важно при использовании твердотельных дисков в программно-определяемой СХД. Кроме того, крупнейшие производители дисковых массивов корпоративного класса при разработке новых поколений своих продуктов все больше ориентируются на усовершенствование их программной части и, напротив, в качестве аппаратной базы стараются использовать серверы x86 и другие стандартные компоненты. Некоторые из них уже заявили, что в будущем рассматривают возможность продвижения используемого в их флагманских СХД программного обеспечения в качестве отдельного продукта SDS. А компания NetApp уже предлагает операционную систему своих СХД FAS как SDS пакет – ONTAP Select. По-видимому, такой вариант SDS должен расширить круг потенциальных заказчиков ведущих поставщиков СХД за счет тех компаний (например, среднего бизнеса и небольших филиалов крупных предприятий), которые до сих пор не могли применять их флагманские системы хранения из-за высокой цены.
Однако использование программно-определяемых СХД вместо традиционных, в которых часть продвинутого функционала хранения реализована на уровне аппаратных средств, имеет и свои недостатки. При покупке традиционного дискового массива заказчик получает и железо, и софт от одного вендора, в то время как при использовании SDS он сначала покупает у одного вендора сервер (серверы) стандартной архитектуры и затем на нем инсталлирует софт от другого вендора для реализации SDS. В итоге получается программно-определяемая СХД на основе продуктов двух поставщиков, и возникает определенный риск, что при каких-либо серьезных проблемах такой СХД разработчик ПО и поставщик серверного оборудования будут перекладывать ответственность друг на друга.

Еще один подводный камень SDS связан с выбором конкретной модели сервера, который будет использоваться как аппаратная платформа программно-определяемой СХД. Формально для этого подойдет любой сервер, конфигурация которого соответствует требованиям разработчика ПО SDS (спецификация процессоров, оперативной памяти, сетевых карт и т. п.), в том числе и устаревший. Однако на практике производительность и бесперебойность работы системы сильно зависит от того, развернута она на дешевом сервере no-name или на серверах известных брендов, где обычно применяются более дорогие аппаратные компоненты, прошедшие тщательное тестирование. Для решения этой проблемы ряд поставщиков SDS подготовили список моделей серверов, которые протестированы на совместимость с их продуктами (так называемый Hardware Compatibility List, HCL). Хотя это не соответствует формальному определению SDS, предлагаемому IDC, наличие HCL упрощают заказчику выбор аппаратной платформы программно-определяемой СХД. Кроме того, как сказано выше, некоторые производители СХД уже предлагают свои SDS как в виде отдельного пакета программ, так и в виде традиционного дискового массива. Второй вариант приобретения системы хранения избавляет заказчиков от необходимости выбирать аппаратную платформу и заниматься инсталляцией ПО на серверы, хотя он обойдется дороже.
Ниже мы рассмотрим несколько продвигаемых на российском рынке решений SDS от ведущих производителей (см. таблицу), ограничившись только продуктами, поставляемыми как пакет программ.

Таблица. Основные модели SDS

Полная электронная версия этой статьи доступна только для подписчиков. Для получения полной электронной версии статьи сейчас Вы можете оформить запрос.