На днях компания AMD выпустила первый чип на базе микроархитетуры Bulldozer. Выпуск решения в пресс-релизе назван «новой вехой в развитии архитектуры x86», и такая высокопарность действительно имеет под собой серьезные основания. Bulldozer (акцент в названии — на способности бульдозеров единовременно перемещать значительные порции материала) — это новая микроархитектура AMD, сменяющая текущую K10.

Если проследить историю архитектурной конкуренции в сегменте x86, ситуация такова. Весьма удачная разработка AMD K8 очень достойно смотрелась на фоне тогдашней NetBurst от Intel. Впоследствии лидер отрасли перешел к архитектуре Core, которая по многим параметрам, как говорится, «делала» и K8, и пришедшую ей на смену K10. Как бы ни строились модельные ряды, ценовая политика и бизнесы компаний, следует констатировать — все последние годы существовал ощутимый разрыв в удельной производительности на ядро между Core и K10.

AMD удавалось многое компенсировать за счет графической части платформы. Скажем, в текущем положении, при продвижении на рынок полноценных вариантов Fusion A на базе ядер K10 явно акцентируется возможность использования мощных интегрированных GPU Radeon в целях поддержки слабоватых ядер CPU. В серверной же области компании приходилось активно играть с позиционированием уже на уровне системы, предлагая четырехсокетовые решения в качестве конкурента двухсокетовым Xeon.

Ныне выходит Bulldozer. Тесты мы увидим позднее. Но уже ясно одно — AMD явно собирается улучшить конкурентное положение в отношении именно базовых вычислительных модулей x86. Это, во-первых, позволит ему воспрять на фактически утерянном (по крайней мере в сравнении со временами K8) рынке серверов, во-вторых, еще сильнее продвинуться в области высокопроизводительных ПК, где теперь компания обладает не только высоконкурентными блоками GPU, но и CPU.

Главной особенностью новой микроархитектуры является недвумысленный акцент на параллелизм исполнения потоков. Если совсем уж в грубом приближении — AMD реализовал что-то типа аппаратной реализации гиперпоточности. При более низкой частоте процессор способен исполнять за такт большее количество инструкций. В процессоре 8 исполнительных целочисленных конвейеров в сравнении с 3-мя у K10 и 4-мя у Core. И эти модули объединены по четыре в отдельные исполнительные блоки. Есть также два исполнительных блока для плавающей арифметики. Это абсолютно новый подход, отличающийся и от Intel Hyper Threading, и от использования большего числа однопоточных ядер в прежних Opteron и Phenom. В некотором роде каждое ядро Bulldozer — это два вычислительных автомата, а не один.

Дмитрий Шульгин, аналитическая компания ITResearch