Варианты развертывания дисковых систем

Существует три основных способа подключения дисковых массивов к серверам, приложения которых работают с хранящимися на массиве данными.

Наиболее простой – это подключение массива к серверу напрямую (Direct Attached Storage, DAS) по интерфейсу SCSI/SAS или Fibre Channel. Хотя затраты на такой вариант развертывания минимальны и скорость обмена данными между СХД и сервером максимальна, он имеет ряд серьезных минусов. Прежде всего, неэффективно используется емкость дисков – если в компании установлено два сервера и к каждому из них напрямую подключен свой массив, то в случае, если на одном из них закончится свободная емкость, его сервер сможет записывать данные на диски другого массива только по локальной сети, к которой подключены оба сервера, что означает крайне медленную скорость обращения к данным и создает большую дополнительную нагрузку на локальную сеть. В основном DAS применяется в небольших фирмах, где имеется только один основной сервер, либо для построения отказоустойчивых кластеров, в которых массив функционирует как общая для серверов кластера система хранения.

Стандартом развертывания дисковых массивов в центрах обработки данных (ЦОД) давно стало их подключение к установленным в ЦОДе серверам через специальную сеть Storage Area Network (SAN) на основе технологии Fibre Channel (за последний год фактическим стандартом индустрии СХД стала 8-гигабитная версия этого интерфейса). Применение архитектуры SAN, которая стала одним из основных компонентов инфраструктуры современного ЦОДа, обеспечивает консолидацию дисковых ресурсов, гибкое распределение емкости массивов между разными серверами и их приложениями, простую миграцию данных между массивами, а также централизованное резервное копирование данных со всех массивов на подключенную к SAN ленточную библиотеку или систему D2D.

Основное препятствие для развертывания SAN в компаниях малого и среднего бизнеса – высокая стоимость и сложность обслуживания сетевого оборудования Fibre Channel. Для них решением может стать построение SAN на основе уже развернутой в офисе локальной сети Gigabit Ethernet с помощью технологии iSCSI. Хотя iSCSI пока существенно уступает Fibre Channel по скорости передачи данных из-за накладных расходов передачи трафика SCSI по IP-сети, переход на 10-Гб Ethernet поможет существенно улучшить быстродействие iSCSI.

Еще одним вариантом сетевого подключения систем хранения является технология Network Attached Storage (NAS), предусматривающая подключение дискового массива к сети по стандартным протоколам Ethernet и использование доступа к хранящимся на его дисках данных на уровне файлов (а не блочного доступа, как при использовании SAN). По-существу, NAS предоставляет собой специализированный файл-сервер, который в отличие обычных файл-серверов Windows или Linux использует оптимизированную под задачи файловых сервисов операционную систему, поэтому обладает более высоким быстродействием и масштабируемостью. NAS достаточно просто развертываются – для них требуется только наличие у заказчика сети Ethernet, однако в их применении есть некоторые ограничения. Сдерживающим фактором для продвижения NAS также является их существенно более высокая цена по сравнению с файл-серверами Windows или Linux на базе стандартных серверов с процессорами x86, так что доля NAS в общем обороте российского рынка СХД незначительна, а основным вариантом применения дисковых массивов у крупных корпоративных заказчиков остается SAN, которым в основном и будет посвящена статья.

Классификация дисковых систем

К старшему классу (high-end) дисковых массивов традиционно относятся так называемые монолитные системы, которые в минимальной конфигурации занимают 19-дюйм шкаф и оборудованы большим числом дисковых контроллеров и внутренним коммутатором cross-bar, обеспечивающим высокую скорость обмена данными между дисками и подключенным к массиву извне (напрямую или через SAN) серверами. Максимальная конфигурация массивов high-end насчитывает более тысячи жестких дисков, размещенных в нескольких шкафах.

Помимо максимального быстродействия и емкости, позволяющих обслуживать одновременно большое число приложений, а также высочайшей отказоустойчивости, эти системы отличаются и мощным встроенным программным обеспечением, реализующим среди прочего удаленную репликацию данных между массивами, находящимися в разных географических регионах, которая требуется для построения катастрофоустойчивых кластеров, гарантирующих непрерывную работу приложений даже в случае крупномасшатбных аварий (например, многочасового отключения системы энергоснабжения всего мегаполиса). Кроме того к этим массивам для расширения емкости можно подключать виртуализованные внешние диски и строить многоуровневое хранение как оперативных, так и архивных данных.

Разумеется, приобрести монолитные системы high-end, стоимость которых в начальной конфигурации составляет порядка 300 тыс. долл. (причем эта сумма значительно увеличится не только по мере расширения аппаратной конфигурации, но и лицензирования дополнительного ПО), способны только крупные корпорации, располагающие большим ИТ-бюджетом, поэтому число их потенциальных заказчиков в нашей стране ограничено. Более перспективным является сектор дисковых СХД среднего класса (mid-range) стоимостью 50–150 тыс. долл. в базовой конфигурации, который, судя по отчетам аналитиков, в последние годы демонстрирует существенно более высокие темпы роста, чем high-end. Эти системы построены по модульному принципу – они состоят из устанавливаемых в 19-дюйм стойке управляющего модуля с контроллерами и подключенных к ним модулей с дисками (дисковых полок). В максимальной конфигурации массив среднего класса масштабируется до двух (некоторые модели – до трех) стоек с десятками дисковых полок и сотнями накопителей. Модульная конструкция СХД среднего класса позволяет снизить первоначальные расходы на покупку – можно приобрести управляющей модуль с одной дисковой полкой, а затем по мере роста объемов данных постепенно приобретать дополнительные дисковые полки. Если требования приложений выросли и СХД не может обеспечить необходимый уровень производительности, то многие модульные массивы позволяют произвести upgrade заменой только одного управляющего модуля без миграции данных или переформатирования имеющихся в системе дисков. Однако в отличие от монолитных модульные СХД оборудованы только двумя дисковыми контроллерами, поэтому серьезно уступают системам среднего класса по быстродействию и отказоустойчивости (при выходе из строя обоих контроллеров массив полностью утратит работоспособность).

Дисковые массивы среднего класса могут использоваться не только для оперативного хранения данных, но и для вторичного хранения как система D2D (если они оборудованы относительно дешевыми дисками SATA большой емкости).

Массивы начального уровня стоимостью от 10 тыс. до 50 тыс. долл. также имеют модульную конструкцию, однако у них возможности масштабирования емкости ограничены несколькими (обычно тремя) дисковыми полками, а возможности подключения хостов – четырьмя портами, поэтому обычно их применяют в небольших SAN для обслуживания нескольких серверов младшего класса либо как систему DAS.

Обычно при анонсе новой СХД вендор четко определяет, к какому классу она относится, и основных потенциальных покупателей этой системы. Так, high-end позиционируется для крупных корпораций, СХД среднего класса и начального уровня – соответственно для среднего и малого бизнеса. Однако на практике такое четко разделение покупателей массивов в зависимости от размера их компании соблюдается не всегда.

Структура товарного предложения

В нашей стране активно продвигают свою продукцию все основные игроки мирового рынка СХД – как компании EMC, HDS и NetApp, у которых основной бизнес связан с дисковыми массивами, так и корпорации Dell, Fujitsu Technology Solutions, HP, IBM и Sun Microsystems, также являющиеся лидерами на мировом рынке серверов. Основные характеристики поставляемой ими техники представлены в четырех таблицах, где вендоры перечислены в алфавитном порядке без учета их доли на российском и мировом рынках. Мы включили только те модели, которые предлагались на отечественном рынке в первой половине 2009 г., в том числе и новые модели, объявленные за последние три квартала (в таблице они выделены жирным шрифтом).

Системы High-End

В «высшей лиге» СХД сейчас фактически представлены только три массива (см. табл. 1) – EMC Symmetrix, IBM DS8000 и HDS USP (напомним, что последний под своими торговыми марками предлагают также HP и Sun). За прошедшие полтора года свое предложение в секторе High-End обновила только EMC (хотя ее конкуренты также постепенно совершенствуют функционал своих продуктов) – ее Symmetrix V-Max отличается от предшественницы Symmetrix DMX-4 новыми возможностями построения катастрофоустойчивых кластеров и увеличенной производительностью подсистемы ввода/вывода, что позволяет, в частности, применять новый массив для развертывания тысяч виртуальных машин. Кроме того, все вендоры объявили о поддержке в массивах твердотельных дисков Solid State Disk (SSD), однако пока эта технология не получила широкого распространения в СХД. SSD работают значительно быстрее жестких дисков Enterprise, и их использование позволяет существенно улучшить производительность массива при обслуживании приложений с интенсивным чтением/записью данных. Кроме того, из-за отсутствия механических компонентов они потребляют значительно меньше энергии, чем обычные жесткие диски, поэтому их применение может существенно улучшить показатели тепловыделение массива. Препятствием для внедрения твердотельных дисков остается их высокая цена (хотя в расчете на гигабайт емкости она быстро снижается) и ограниченный по сравнению с традиционными жесткими дисками цикл чтения/записи, из-за чего скорость SDD может деградировать с течением времени.

Все вендоры наряду с традиционными «монолитными» системами предлагают и младшие системы high-end – это IBM DS6800, HDS USP VM, Sun Storagetek 9985V или HP StorageWorks XP20000, EMC Symmetrix V-Max SE и DMX-4 950. За исключением последних двух массивов EMC остальные младшие модели high-end имеют модульную, а не монолитную конструкцию и значительно уступают флагманским моделям по максимальной емкости. Часто такие системы приобретаются для резервного ЦОДа, где они выполняют функцию «дублера» старшей модели high-end того же вендора, установленной в основном ЦОДе, либо их заказчиками становятся компании, для которых требуется наивысшая производительность и отказоустойчивось при относительно умеренных требованиях к емкости. В ряде случаев их цена может быть сопоставима со стоимостью старших моделей среднего класса, что делает их доступными для компаний среднего бизнеса, имеющих «продвинутую» ИТ-инфрастурктуру.

Несмотря на относительную стабильность российского рынка уровня high-end, уже в этом году здесь может появиться новый игрок. Хотя формально Symmetrix по условиям реселлерского соглашения (но под маркой EMC) продвигает компания Fujitsu Technology Solutions, которой партнерские отношения с EMC достались в наследство от Fujitsu Siemens Computers, однако, по-видимому, еще до конца года японский вендор выведет на рынок EMEA массив старшего класса собственного производства Eternus S8000, как и массив среднего класса Eternus S4000. Пока же российским заказчикам Fujitsu Technology Solutions доступны только массивы начального уровня Eternus DX60 и DX80.

Системы среднего класса

Системы среднего класса можно достаточно четко разделить на группы – начального уровня, масштабируемые чуть более 100 дисков, среднюю и старшую, которые поддерживают соответственно в два и четыре раза больше дисков. Все три модели одного вендора имеют одну и ту же архитектуру, поэтому upgrade на более мощную модель выполняется достаточно просто без миграции данных, причем часто преемственность сохраняется и на уровне разных поколений. Например, как утверждает EMC, владельцы старых Clariion CX3 могли перейти на CX4 заменой управляющего модуля массива.

В последние два квартала 2008 г. все вендоры представили свои новые модели СХД среднего класса, что говорит о динамичности развития этого сектора рынка. Помимо улучшения быстродействия за счет перехода на 8-гигабитный Fibre Channel и масштабирования новых систем, тенденцией последних лет стало реализация в них ряда функций более дорогих систем high-end, прежде всего обеспечения защиты данных от аппаратных сбоев, что постепенно расширяет возможности их применения в корпоративной ИТ-инфраструктуре и хранения данных критически-важных приложений.

Из новинок 2008 г., которые фактически вышли на рынок уже в текущем году, особого внимания заслуживает семейство HDS Adaptive Modular Storage (AMS) 2000, в которой вместо дисков Fibre Channel используются накопители на основе технологии Serial Attached SCSI (SAS). Как утверждает HDS, переход от Fibre Channel к SAS значительно упрощает архитектуру и обслуживание массива и позволяет устанавливать в одной дисковой полке накопители Enterprise и SATA, а не приобретать для последних отдельную полку. Компания EMC (как и ее OEM-партнеры Dell и Fujitsu) включила в свою новую линейку Clarrion CX4 модель, которая поддерживает 960 дисков, т. е. по емкости Clarrion CX4-960 вполне может конкурировать с системами high-end.

Системы начального уровня

Массивы начального уровня часто приобретают в комплексе с серверами стандартной архитектуры, поэтому в этом секторе традиционно сильные позиции у серверных вендоров, которые предлагают массивы, оптимизированные для обслуживания своих серверных систем. Например, система HP StorageWorks MSA2000 рассчитана прежде всего на работу в связке с ее же серверами HP Proliant и даже позволяет переставлять в массив диски из Proliant.

Основной тенденцией массивов начального уровня последнего года стал постепенный переход вслед за серверной индустрией на 2,5-дюйм форм-фактор накопителей (Small Form Factor, SFF) и внедрение SAS взамен классического параллельного SCSI. Использование 2,5-дюйм вместо обычных 3,5-дюйм дисков (Large Form Factor, LFF) позволяет увеличить плотность размещения гигабайтов на единицу пространства, а также улучшает производительность приложений с интенсивным чтением и записью за счет увеличения числа дисков. Применение SAS позволяет упростить архитектуру массива и комбинировать в одной полке диски Enterprise и SATA, а также снимает присущее SCSI ограничение масштабируемости дисковой системы и улучшает ее надежность.

Практически все массивы этого класса масштабируются до нескольких десятков дисков (за исключением рассчитанного на малый бизнес HDS SMS100) и поставляются в трех модификациях в зависимости от варианта подключения к ИТ-инфраструктуре – с интерфейсом SAS для прямого подключения к серверу, с адаптером Fibre Channel для интеграции в традиционную SAN на основе оптоволоконной технологии, и, наконец, с интерфейсом iSCSI для использования в составе сетей хранения, построенных на базе Ethernet.

В то же время растущий интерес к технологии iSCSI в связи с переходом на 10-Гб Ethernet заставил компании Dell и HP включить в свой портфель продукты, разработанных специально для сетей хранения iSCSI и реализующие аналоги функций виртуализации, применяющихся в системах среднего и высшего класса. Речь идет о системах Dell EqualLogic и HP LeftHand, изначально созданные фирмами, специализировавшимися на iSCSI и поглощенными этими вендорами. Любопытно отметить, что в истории Dell поглощение EqualLogic стало самой крупной сделкой, что говорит о высоких ставках компании на технологию iSCSI.

NAS-системы

В секторе NAS основная борьба идет между NetApp, чьи системы под своей торговой маркой также продвигает IBM, и EMC. В течение прошлого года компания NetApp обновила свою линейку FAS, установив в управляющие модули более мощные процессоры и расширив объем оперативной памяти, что позволило увеличить масштабируемость емкости. NetApp также одной из первых объявила о планах использования твердотельных дисков, причем не только для оперативного хранения данных, но и в качестве кэш-памяти дисковой системы. В свою очередь EMC, у которой в качестве аппаратной платформы Celerra используются Clariion CX, после выпуска CX4 провела обновление модельного ряда своих NAS-систем.

Классификация NAS-систем примерно совпадает с классификацией массивов среднего класса – модели, масштабируемые примерно до 100 дисков, относятся к начальному уровню, а средние и старшие модели поддерживают около 500 и 1000 накопителей соответственно.

Полная электронная версия этой статьи доступна только для подписчиков. Для получения полной электронной версии статьи сейчас Вы можете оформить запрос.