AMD помогает после критики от Джона Кармака о $4,000 NVIDIA DGX Spark. Говорит о низкой производительности, перегреве и энергопотреблении в 100 Вт. Разработчики жалуются на сбои и отключения.

Nvidia столкнулась с критикой после того, как Джон Кармак, бывший технический директор Oculus VR, начал задавать вопросы о реальных характеристиках производительности и энергопотреблении новой мини-платформы ПК DGX Spark за 4000 долларов, которая работает на суперчипе Grace Blackwell GB10. Это привлекло внимание представителей компаний Framework и AMD, которые предложили свои варианты – альтернативу от AMD с чипом Strix Halo.

В своем посте в социальной сети X Кармак отметил, что максимальное энергопотребление DGX Spark составляет 100 Вт, что заметно ниже заявленного значения в 240 Вт. Nvidia рекламирует производительность вычислений со спарсностью FP4 на уровне одного петафлопса, но Кармак предполагает, что плотный эквивалент должен составлять около 125 терафлопс. Он заявил, что фактически получает гораздо меньшую производительность. Кроме того, специалист обратил внимание на проблему “самопроизвольного перезапуска при длительной работе” и задал вопрос о возможном снижении технических характеристик системы перед запуском в массовое производство.

Независимые тесты от ServeTheHome показали, что розничная единица Spark потребляет около 200 Вт под нагрузкой CPU+GPU. Полная мощность в 240 Вт не была достигнута ни в одном из тестируемых сценариев нагрузки.

Привлеченный громкими заявлениями Nvidia, компания Framework предложила Кармаку попробовать свой вариант системы на базе AMD Strix Halo. Вице-президент по программному обеспечению для искусственного интеллекта компании AMD Анур Эланговану даже присоединился к обсуждению, выразив готовность поддержать дальнейшие исследования в области Strix Halo.

Пост Кармака запустил широкое обсуждение реальных обещаний Nvidia. Упоминаемый петтафлопс связан с использованием FP4 и спарсности 2:4, что позволяет удвоить производительность, но применимо только для определенных матричных операций. В более плотных форматах, таких как FP8 или BF16, теоретическая максимальная производительность значительно снижается. Согласно спецификациям Nvidia, система обладает памятью шириной 273 ГБ/с и общим объемом унифицированной LPDDR5X в 128 ГБ, разделенной между 20-ядерным процессором Grace от Nvidia. Это делает DGX Spark системой с ограниченным доступным потенциалом из-за недостаточного объема памяти по сравнению с оборудованными GPU системами HBMB.

Пока неясно, какие именно факторы приводят к этой субоптимальной производительности — возможно, это программная ограничение или термическая нагрузка. Представители компании Nvidia до сих пор публично не прокомментировали пост Кармака и сообщения пользователей о нестабильной работе устройства. В то же время несколько веток на форумах разработчиков Nvidia уже переполнены отчетами о сбоях GPU и неожиданных выключениях при продолжительных нагрузках.

Несмотря на ранние стадии развития DGX Spark, ожидания среди пользователей относительно GB10 остаются высокими. Nvidia предстоит объяснить причины возможного оставления значительного потенциала производительности в своем флагманском устройстве для разработчиков.

Tags: