Первые детали Nvidia DGX A100 — архитектура Ampere и 5 петафлопс производительности за $200 тысяч

Первые детали Nvidia DGX A100 — архитектура Ampere и 5 петафлопс производительности за $200 тысяч

На этот раз презентация новой графической архитектуры Nvidia прошла без той шумихи, которая была на демонстрации Turing. Коронавирус вынудил компанию пойти на необычные меры — презентация с Хуангом была записана на кухне главы Nvidia и опубликована в нескольких частях на ютубе. Кроме того, на официальном сайте сразу появился десяток новостей, от которых разбегаются глаза. Так как GTC посвящена разработчикам, то относительно новой архитектуры Ampere для игровых видеокарт ничего не сказали. 

Презентация вращалась вокруг "видеокарты" A100, рассчитанной на профессионалов и поставляемой в виде набора DGX A100. 

Ключевые подробности A100 и DGX A100:

  • Размер чипа A100 составлет 826 мм2 — новый рекорд (у V100 было 815 мм2)
  • A100 производится на основе 7нм техпроцесса
  • Чип включает 54 миллиарда транзисторов — для сравнения, у 2080 Ti "всего" 18.6 миллиардов
  • A100 включает 6912 FP32 CUDA ядер, 3456 FP64 CUDA ядер и 422 тензорных ядра
  • A100 продают в комплекте DGX A100, куда входит 8 чипов A100, 2 64-ядерных процессора AMD, 1 ТБ RAM и 15 ТБ NVME
  • DGX A100 стоит $200 тысяч, что на $50 тысяч дороже DGX-1, но Nvidia утверждает, что A100 в 20 раз быстрее в качестве ИИ-интерфейса и для тренировки сетей
  • Каждый A100 включает 40 ГБ памяти HBM2
  • Nvidia обещает 5 петафлопс производительности для DGX A100

Что все это значит для игровых видеокарт? По сути, ничего. Компания вряд ли перейдет на использование HBM в потребительских GPU, что же касается производительности, то на основе A100 сложно делать какие-то выводы. Без сомнения, мощность станет выше, трассировка лучей будет работать лучше, но никаких конкретных цифр из данных Nvidia спрогнозировать невозможно.

Скорее всего, анонс видеокарт Nvidia на Ampere задержится до августа. А там и AMD должна со своей архитектурой подоспеть. 

21 Комментарий

  • artman
    Комментарий скрыт. Показать

    Если бы хоть график сравнения с предыдущим поколением, можно было бы примерно прикинуть буст пр-ти новой архитектуры... Эх Хуанито, зажал инфу негодник :)

    0
    • CohenCohen
      Комментарий скрыт. Показать

      @artman, а толку, это настолько узконаправленное решение, что скука

      3
    • Soto
      Комментарий скрыт. Показать

      @artman, воть

      1
    • artman
      Комментарий скрыт. Показать

      @Soto, т.е. фп32 19,5 тфпс, это уже интересно... У 3080ти явно будет меньше.

      0
    • PunkRoy
      Комментарий скрыт. Показать

      @artman, там явно будет не меньше 26 тфпс.

      0
    • artman
      Комментарий скрыт. Показать

      @PunkRoy, для 50% прироста достаточно примерно 20тфпс.
      26тфпс это уже слишком мощный буст относительно предыдущего поколения, что бы быть правдой...

      0
    • PunkRoy
      Комментарий скрыт. Показать

      @artman, Даже quadro 6000 с небольшим разгоном выдает 18.6, а серверные tesla почти 19 (но это не точно в отличии от quadro я из даже в живую не видел но мне так сказали).

      0
    • magBet
      Комментарий скрыт. Показать

      @Soto, @artman, что то не то с этой картинкой, на видосе с кейнота у а100 на графике показали разницу с в100 в fp64, просто 64 без тензорных, и там было у а100 20 тфлопс, значит fp32 все 40 тфлопс

      0
    • artman
      Комментарий скрыт. Показать

      @magBet, значит нужно ждать более точную инфу, но 40 тфпс это конечно... :)

      0
  • DarckNEZ
    Комментарий скрыт. Показать

    для обычного компа это не подойдёт - грустно
    (-_-)

    0
  • Комментарий скрыт. Показать

    А как вообще взаимодействовать с такой мощностью? Что нужно делать, какие вычислительные процессы выполнять? Понятно, что это скучные технические описания работы нейросетей, их обучения, но всё-таки... Как это используется и монетизируется вообще?

    0
    • CohenCohen
      Комментарий скрыт. Показать

      @QTuzoff, тренировка нейросеть и всяких ИИ-систем

      Эти процессы чертовски прожорливые

      0
  • Endorphin
    Комментарий скрыт. Показать

    Знаю все хотят знать, потому и спрошу
    Сколько фпс будет в гта 5 и в кс:го?

    4
  • Bayton
    Комментарий скрыт. Показать

    А Валхалу потянет на максималочках в 4к и 60 fps?

    3
  • BruceRobertson
    Комментарий скрыт. Показать

    Что это за числа такие в характеристиках... Слишком монструозно даже для разработки

    0
    • dimidrum
      Комментарий скрыт. Показать

      @BruceRobertson, дык это решение для этаких мини суперкомпьютеров по сути. Чисто для исследований и симуляций. В голову еще приходят киностудии, которые на стадии vfx работают с терабайтами данных... но хз, есть ли какой-то смысл менять фермы на подобное решение.

      0
    • BruceRobertson
      Комментарий скрыт. Показать

      @dimidrum, я знаю, что для профессионалов это. Но я на потребительский лад в первую очередь оцениваю цифр ы

      0
  • MarcOchezeriob
    Комментарий скрыт. Показать

    Я думаю Кризис 1 без патчей должно потянуть нормально, без просадок.

    1
  • Spoonty
    Комментарий скрыт. Показать

    Я смогу на этой штуке Стар Ситизен запустить?

    1
  • Dantual
    Комментарий скрыт. Показать

    Ждем шуток про то, что ПК-бояре могут петафлопсы, а консольщики будут еще лет 8 на терафлопсах... И про то, что консоли тормозят индустрию, конечно же...

    1
Войдите на сайт чтобы оставлять комментарии.