О товарном предложении серверов сегмента high-end

Дмитрий Шульгин, старший эксперт ITResearch

За последнее время в сфере многосокетных серверов стандартной архитектуры произошли глобальные перемены. Фактически сектор накрыла волна тотальной реструктуризации. Ее наступление связано с появлением четырехсокетных решений среднего уровня, нацеленных в принципе на те же сценарии использования, что и старшие двухпроцессорники. «Больше процессоров и памяти в том же конструктиве» — вот приблизительное описание общего лозунга, под котором такие решения проникают на рынок сегодня. Концепция впервые проявилась в линейке AMD Opteron 6000, и в части маркетинга была оформлена как «отмена налога 4P». До этого четырехпроцессорные SMP-комплексы всегда отстояли на значительном расстоянии от остального рынка, как в ценовом плане, так и с точки зрения областей применения. С появлением в арсенале Intel процессоров семейства Xeon E5-4600, выполненных в той же концепции, реструктуризация рынка стала неминуема. Количество сокетов в системе перестало быть определяющим фактором для сегментации моделей по секторам high-end и middle-range.

А вот системы стандартной архитектуры, изначально ориентированные на многопроцессорные конфигурации, дошли до реального столкновения с RISC-серверами среднего уровня, что во многом и изменило их современный облик. Именно о таких решениях из области «истинного» high-end и пойдет речь в настоящем обзоре.

Процессором, традиционно ориентированным на сектор high-end, была линейка Intel Xeon 7000. Значимые архитектурные изменения произошли здесь с выпуском поколения Xeon 7500 и, позднее, встающего на туже платформу Xeon E7. Они работают в связке с чипсетом Intel 7500, ответственного ныне за подсистему ввода-вывода. (Остальные функции чипсета в современных процессорах, и не только серверных, ушли на кристалл процессора.)

В чипах E7 реализована поддержка 4-х каналов QPI, то есть процессоры в четырехсокетной системе можно соединить между собой по схеме каждый-с-каждым и еще один канал остается на связь с шиной ввода/вывода PCI. В E5-4600 — только два канала QPI и этот факт, пожалуй, является главным архитектурным отличием старшей линейки от средней. Плюс чипы E7 имеют до 10 физических ядер CPU, до 30 Мбайт кэш-памяти третьего уровня и поддерживают до 16 модулей памяти на один чип. В четырехсокетных решениях это дает до 64 модулей DIMM, обеспечивающих размер ОЗУ до 2 Тбайт.

У E5-4600 предельные значения этих параметров пониже. Но в реальности и в той линейке есть старшие модели чипов, на которых можно создать систему, по базовой производительности на средних нагрузках вплотную приближающуюся к E7. Дело в том, что в параметрах речь идет все же о предельно допустимых комплектациях. И возможности, обеспечиваемые системами на базе E7, оцениваются заказчиками, скорее, как основа для дальнейшего масштабирования. Действительно, словосочетание scalable performance мы встречаем в материалах по рассматриваемой теме много чаще, чем, скажем extra performance.

Как бы то ни было, высочайшая производительность и огромные объемы ОЗУ детерминируют и направленность серверов на E7 — бизнес-критичные приложения и сверхбольшие базы данных. Основные сферы, в которые сегодня нацеливаются серверы high-end: корпоративные системы ERP, CRM, бизнес-аналитика, системы поддержки принятия решений, хранилища данных и т. п. Естественно, есть и определенный пул задач виртуализации, достойных использования вычислительных блоков этого уровня. Это так называемая тяжелая виртуализация, когда консолидации подвергается высоконагруженная виртуальная машина с большими требованиями к размерности ОЗУ и интенсивности ввода/вывода.

Что касается задач HPC — научные расчеты и т. п., то эта сфера больше благоволит к использованию кластеров из меньших систем, и для организации вычислительного процесса здесь все чаще используются профессиональные GPU. Применимость высокопроизводительных по базовой начинке серверов здесь ограничена. Другие типовые вопросы — web-нагрузки, большинство задач по виртуализации, управление ИТ-инфраструктурой и пр. — сегодня решаются серверами уровня Xeon E5.

Таким образом, новое поколение конкурирует в основном на рынке бизнес-критичных окружений. Этот факт определяет и основное отличительное свойство современных Xeon E7. Именно оно наиболее явственно отделяет подкласс систем high-end от решений на базе E5-4600 или Opteron, одновременно ставя их в прямую оппозицию RISC-серверам (речь о встроенных на аппаратном уровне функциях RAS).

Функции RAS — Reliability (надежность), Availability (отказоустойчивость) и Serviceability (обслуживаемость) — всегда были атрибутами процессоров Power, SPARC и Itanium. Предложение этого функционала для серверов стандартной архитектуры можно счесть последним колом, загнанным в сжимающийся сегмент RISC-решений среднего класса. Ведь по производительности современные ядра Intel и AMD зачастую превосходят любые альтернативы. То же и со стоимостью конечных решений, как закупочной, так и ценой эксплуатации. Фактически единственной основой, поддерживающей в таких условиях продажи массовых RISC-решений, остается программный уровень. Инвестиции, совершенные заказчиками в UNIX-окружение, делают задачу по уходу на системный базис x86 малорентабельным. И для поставщиков серверов high-end стандартной архитектуры ныне становится более значимым не столько аппаратный, сколько программный слой, например, развитие инфраструктуры Linux корпоративного уровня.

Триада RAS и другие особенности современной архитектуры Intel

Так что же именно представляет собой RAS в исполнении Intel? По сути, на аппаратном уровне в чипы встраивается механизм, выявляющий, корректирующий или, в сложных случаях, изолирующий ошибки, возникающие в каналах обмена данными внутри CPU, контроллерах памяти, самих модулях памяти, шинах QPI и PCI. Это различные функции дублирования, зеркалирования и миграции данных во всех критичных подсистемах. В частности, реализовано до 13 функций RAS, нацеленных на исправление или локализацию ошибок памяти, до 14 функций повышения надежности работы CPU, каналов межпроцессорных соединений и внешнего ввода/вывода.

Дополнительно реализован механизм Intel Machine Check Architecture (MCA), способный передавать информацию о неисправимых аппаратных ошибках на программный уровень BIOS, ОС или гипервизора. Что позволяет перенести программные потоки на работоспособные участки, предотвратив фатальный сбой работы приложений. (Изначально MCA, как и другие механизмы, был реализован в Intel Itanium.)

Подобные решения относятся уже к RAS уровня сервера. Естественно, операционная система, гипервизоры и firmware должны поддерживать соответствующие функции. Соответственно здесь есть пространство для подготовки фирменных решений поставщиков серверов и системного ПО, привязанных к аппаратно реализованным механизмам Intel. И здесь уже надо внимательно рассматривать документацию по каждой модели или хотя бы фирменной линейке серверов.

Следующим моментом, непосредственно связанным с изменением системной архитектуры современных процессоров, стала возможность более гибкого масштабирования многосокетных систем. Она определятся наличием в современных архитектурах Xeon и Opteron внутрисистемного взаимодействия по кэш-когерентным шинам QPI и HyperTransport соответственно. Это позволяет гибко масштабировать архитектуру системы от двух до четырех процессоров, но этим дело не заканчивается.

В арсенале компаний HP, Sun, Fujitsu присутствуют и восмисокетные решения на базе Xeon E7, среди которых можно отметить два основных подхода. Во-первых, самый очевидный, именуемый glueless. Процессоры соединяются между собой напрямую по каналам QPI без каких-либо дополнительных звеньев. При этом максимальный путь от одного чипа до другого может составлять два хода. (Четвертый канал QPI отдается на связь CPU с чипсетом ввода/вывода и в межпроцессорном обмене задействован быть не может.) Такой подход применен Fujitsu и Sun. По факту QPI-линки заведены на объединенный канал, размещенный на объединительной плате. К ней подключаются платы-модули с процессорами и памятью, у Sun — по два процессора на модуль, а у Fujitsu — восемь отдельных плат с процессором Xeon E7-8800 каждая.

Компания HP в рамках фирменной архитектуры PREMA предлагает иной подход. Здесь применяются дополнительные контроллеры XNC, объединяющие двухпроцессорные ноды и синхронизирующие информацию из кэш-памяти процессоров. Каждый чип подключен напрямую к соседу по ноду и к двум XNC, таким образом, он «видит» всю систему.

IBM же предпочитает составлять восмисокетные комплексы из двух четырехсокетных модулей System x3850/x3950, к которым дополнительно можно добавить специальный модуль расширения ОЗУ MAX5.

Двухсокетные модели

С другого конца ценовой шкалы стоят решения в двухсокетном исполнении на базе Xeon E7-2800. Процессоры уровня high-end под двухпроцессорные конфигурации появились в семействе Xeon не впервые. В предыдущем поколении платформы существовала серия Xeon 6500, отличавшаяся поддержкой большего объема памяти. В ассортименте такие серверы встречались не часто вследствие специфичности применения. Очевидно, основная направленность таких старших двухсокетных систем — та самая «тяжелая» виртуализация, зачастую чрезвычайно требовательная к размерности ОЗУ и пропускной способности I/O. Плюс, здесь сохраняется компактность конструктива, экономится энергопотребление и, конечно, стоимость в сравнении с классическими четырехпроцессорниками на E7. Главным примером такой системы является сервер IBM System x3690. Вендор также использует двухпроцессорное решение в своей blade-инфраструктуре, на этой базе выполнен старший blade-модуль на стандартной архитектуре — BladeCenter HX5. Как и в случае с рэковыми четырехпроцессорниками IBM, эти лезвия могут объединяться в пары для получения четырехпроцессорной конфигурации с возможностью использования модуля расширения памяти MAX5. Двухпроцессорное исполнение заинтересовало и компанию HP, которая реализовала его в blade-сервере ProLiant BL620.

Лезвийные модели на high-end-обвязке под четыре сокета присутствуют в линейках HP, Dell, IBM и Cisco.

Решения главного конкурента

А что же AMD? В линейках большинства вендоров присутствуют решения на платформе AMD G34 под Opteron 6000. Компания не ограничивает модели своих процессоров по количеству поддерживаемых в системе чипов. Opteron 6200 и новейшее поколение — 6300 встают как в двух- так и в четырехсокетные системы. Процессоры AMD имеют до 16 вычислительных ядер, правда, эти ядра по-прежнему проигрывают Intel по базовой производительности, хотя уже и не так разительно, как прежде. Система на базе AMD способна поддерживать до 512 Гбайт ОЗУ, что явно меньше предельных показателей архитектуры Intel. О расширениях в виде функций RAS речи здесь не ведется. При этом вычислительный механизм AMD оказывается силен в расчетах с плавающей точкой. Ну, а главное, — это весомое преимущество по соотношению цена/производительность, которую традиционно демонстрируют решения на данной компонентной базе.

В целом системы на базе Opteron 6200/6300 с четырьмя процессорными сокетами по позиционированию оказываются где-то между системами на базе Xeon E5-4600 и E7-4800. На Opteron выпускаются системы, конструктивно схожие со старшими решениями на базе E5 — как правило, это рэковый конструктив 2U с внушительным внутренним дисковым пулом. Таких моделей много у отечественных сборщиков, есть такое решение и у IBM.

По совокупности все это, скорее, роднит обвязку AMD с решениями среднего класса на E5, чем с high-end на базе E7. Но вендоры, такие как HP и Dell, позиционируют свои модели на AMD по-прежнему в одном ряду со старшими решениями Intel.

Полная электронная версия этой статьи доступна только для подписчиков. Для получения полной электронной версии статьи сейчас Вы можете оформить запрос.