Nvidia GP100 — первый Pascal
Вчера Nvidia анонсировала первый GPU на новейшей микроархитектуре Pascal — GP100, а также первый ускоритель на его основе — Tesla P100, ускоритель, правда, не трёхмерной графики, а вычислений. Но это не имеет значения. Важно то, что уже можно оценить характеристики нового графического монстра и сделать общие выводы об особенностях Паскаль.
Чип производится на мощностях TSMC с соблюдением норм 16-нм технологического процесса. Имеет площадь 610 квадратных мм и состоит из 15,3 млрд. транзисторов. В составе GP100 нашли своё место 3840 универсальных потоковых процессоров - ядер CUDA в терминологии Nvidia, которые сгруппированы в 60 блоков SM - Streaming Multiprocessor (в каждом по 64 ALU), 240 блоков выборки и фильтрации текстур.
На одной подложке с гпу расположены и 4 микросхемы памяти HBM второго поколения общим объёмом 32ГБ, сообщающиеся с гпу через 4096-битную шину памяти.
Что касается ускорителя вычислений Tesla P100, то в нём используется слегка усечённая версия GP100, состоящая из 56 SM (3584 ядер CUDA) и 224 TMU. Все эти компоненты работают на частоте ядра в 1328МГц в базовом режиме и 1480МГц в boost. При этом, особенностью старшего Паскаля является то, что соотношение шейдерных ядер выполняющих вычисления с одинарной и двойной точностью составляет 2:1, то есть из 3840 ALU ровно половина могут производить FP64 вычисления. Тогда будет нетрудно подсчитать общую максимальную вычислительную мощность всего шейдерного блока при выполнении операций с плавающей запятой одинарной и двойной точности: 9,5 и 4,8 терафлопс в базовом и 10,6 и 5,3 терафлопс в boost режиме.
Что касается памяти, то её объём тоже уменьшен, в 2 раза и работают эти 16ГБ HBM на эффективной частоте 1,4ГГц, и итоговая пропускная способность шины памяти, таким образом, составляет впечатляющие 716,8ГБ/с!
Тепловой пакет ускорителя составляет 300Вт. Из этого можно предположить, что Tesla P100 будет снабжаться парой 6-контактных или одним 8-контактным разъёмами дополнительного питания.
По последним данным, старший Паскаль никогда не будет использоваться в графических ускорителях, только в серии Tesla и выйдет на рынок не ранее начала следующего года. А в этом году экспансией новейшей архитектуры Nvidia в игровом сегменте займутся видеокарты на младших гпу: GP104/106/...
- GPU Nvidia Blackwell могут стоить до $35,000, а ИИ-серверы — до $3 миллионов
- Следующее поколение GPU от Nvidia носит кодовое название Rubin, а релиз запланирован на конец 2025 года
- Инсайдер: NVIDIA выпустит RTX 5080 перед RTX 5090