Следующее поколение GPU для ИИ от Nvidia может потреблять до 1000 Ватт

Крупнейший производитель серверов Dell раскрыл детали о грядущих GPU для ИИ от Nvidia с кодовыми именами Blackwell. Оказывается эти процессоры будут потреблять до 1000 Ватт, что на 40% больше предыдущего поколения. Поэтому Dell придётся задействовать все свои инженерные умения по охлаждению. Комментарии Dell также намекают на некоторые архитектурные особенности новых GPU для вычислений от Nvidia.

Мы с нетерпением ждём то, что произойдёт с H200 и улучшением его производительности. Также интересно посмотреть на B100 и B200, где появится ещё одна возможность продемонстрировать наши инженерные компетенции в теплоотводе. На самом деле, для рассеивания 1000 Ватт на GPU не нужна прямоточная жидкостная система охлаждения.

Не зная планов Nvidia относительно архитектуры Blackwell, можно взглянуть на правило: теплоотвод ограничен 1 Ваттом на квадратный миллиметр площади кристалла.

С этой точки зрения становится интересно: у H100 (на 4 нм техпроцессе) уже 700 Вт тепловыделения вместе с HBM-памятью, а размер кристалла составляет 814 кв.мм - то есть меньше 1 Вт на кв.мм. Для следующего GPU, возможно, на 3 нм техпроцессе при таком уровне энергопотребления имело бы смысл сделать двухкристальную архитектуру, чтобы увеличить площадь для отвода тепла. Подобный подход уже использовали AMD и Intel для своих GPU.

Финансовый директор Dell решила прокомментировать архитектуру Blackwell, заявив при этом технологическое превосходство компании в охлаждении:

Это произойдёт в следующем году с B200. У нас появится возможность продемонстрировать инжиниринг, скорость работы в промышленной жидкостной системе охлаждения в масштабе — будь то химия жидкостей, производительность, телеметрия, управление питанием и так далее. Это позволит нам масштабировать решение на рынок, чтобы воспользоваться невероятной вычислительной мощностью, которая там появится.

Сколько будут стоить эти решения, пока неизвестно.

Больше статей на Shazoo
Тэги: