Bolt Graphics анонсировала серию ускорителей Zeus для высокопроизводительных вычислений, рендеринга, трассировки лучей и компьютерных игр. Желающие смогут установить на видеокарту дополнительные 128 Гбайт RAM (два модуля SO-DIMM).
Скалярная часть нового GPU построена на базе спецификации RISC-V RVA23, а векторная представлена FP64 ALU на базе несколько модифицированной RVV 1.0. За остальные функции отвечают кастомные расширения и отдельные блоки-ускорители. Все они пользуются общим кэшем объёмом 128 Мбайт. Блок телеметрии и внутренний интерконнект предназначены для общения с другими вычислительным блоками.
Базовый «строительный блок» Zeus 1c26-032 включает GPU-чиплет. Он соединён с 32 Гбайт набортной памяти LPDDR5x (273 Гбайт/с) и контроллером внешней памяти DDR5 (90 Гбайт/с. В GPU-чиплет встроены контроллеры DisplayPort 2.1a и HDMI 2.1b, с внешним миром он общается посредством IO-чиплета через канал 256 Гбайт/с.
IO-чиплет предлагает, помимо двух интерфейсов PCIe 5.0×16 (по 64 Гбайт/с), также выделенный порт RJ-45 для BMC и 400GbE-порт QSFP-DD. Наконец, аппаратный блок видеокодирования может обрабатывать два потока 8K@60 AV1/H.264/H.265.
Уровень производительности в векторных вычислениях FP64/FP32/FP16 составляет 5/10/20 Тфлопс, а в матричных INT16/INT8 — 307,2/614,4 Топс. Аппаратный блок ускорения лучей (path tracing) выдаёт до 77 гигалучей против 32-х у Nvidia RTX 5090 c производительность. FP64 на уровне 1,6 Тфлопс. Однако в расчётах пониженной точности ускорители Nvidia работают быстрее Zeus 1c26-032.
При этом уровень TDP у Zeus составляет всего 120 Вт, а второй интерфейс PCIe 5.0 x16 можно использовать для прямого объединения двух карт.
Вариант ускорителя с двумя чиплетами назвали Zeus 2c26-064/128, а с четырьмя — 4c26-256 из-за объёма распаянной памяти LPDDR5X.
Количество доступных разъёмов SO-DIMM также зависит от модели и может составлять до восьми. В итоге флагманскую конфигурацию с базовыми 256 Гбайт LPDDR5x можно дополнить 2 Тбайт DDR5. В Zeus 2c26-064 и Zeus 2c26-128 с TDP 250 Вт есть только один IO-чиплет, а GPU-чиплеты объединены шиной со скоростью 768 Гбайт/с.
Zeus 4c26-256 получил четыре I/O чиплета, которые дают восемь контроллеров PCIe 5.0×4 (один чиплет, совокупно 32 линии) и шесть 800GbE-портов OSFP (три чиплета).
Между собой GPU-чиплеты объединены шиной со скоростью 512 Гбайт/с. Каждый из них соединён с собственным IO-чиплетом на скорости 256 Гбайт/с. TDP составляет 500 Ватт, а ускоритель развивает 20 Тфлопс в режиме FP64, почти 2500 Топс на вычислениях FP8 и способен обрабатывать до 307 гигалучей.
Для целей кластеризации предусмотрены как конфигурации из двух GPU, соединённых Ethernet 400GbE, так и системы уровня стойки с 80 платами Zeus 4c26-256.
Такой кластер потребляет 44 кВт, но способен обеспечивать запуск крупных физических симуляций или обучение ИИ, имея массив памяти 160 Тбайт, производительность 1,6 Пфлопс в режиме FP64 и 196 Попс в режиме FP8.
Zeus получили трассировщик лучей Glowstick, способный работать в режиме реального времени практически во всех современных пакетах 3D-моделирования или видеоредактирования, в том числе Maya, 3ds Max, Blender, SketchUp, Houdini и Nuke. Фирменная библиотека Bolt MaterialX содержит более 5000 текстур высокого качества. Благодаря поддержке стандарта OpenUSD трассировщик сможет легко интегрироваться в любую цепочку рендеринга и пост-обработки. Также запланирован выпуск электромагнитного симулятора Bolt Apollo, драйверов Vulkan/DirectX и SDK с использованием LLVM.
Доступ к комплектам разработчика Bolt Graphics обещают в четвёртом квартале этого года. В третьем квартале 2026-го должны появиться 2U-серверы на базе Zeus, а массовые поставки серверов и PCIe-карт начнутся не ранее четвёртого квартала.