DeepSeek представила V4 на 1,6 триллиона параметров, обученную на чипах Huawei – американские компании обвиняют в краже ИИ-технологий

Китайская лаборатория DeepSeek выпустила превью своей самой мощной языковой модели – V4. Модель включает 1,6 триллиона параметров и контекстным окном в 1 миллион токенов. Это первый крупный релиз передового класса, оптимизированный под ИИ-процессоры Huawei Ascend, а не под оборудование Nvidia.

Запуск пришёлся на тот же день, когда агентство Reuters сообщило о дипломатической телеграмме Госдепартамента США. По данным издания, документ был разослан в посольства по всему миру с указанием предупреждать иностранные правительства о предполагаемой краже интеллектуальной собственности со стороны DeepSeek и других китайских ИИ-компаний.

V4 представлена в двух вариантах. Флагманская версия V4-Pro обойдётся клиентам в 3,48 доллара за миллион токенов на выходе. Облегчённая V4-Flash на 284 миллиарда параметров стоит 0,28 доллара. Для сравнения, OpenAI сейчас берёт 30 долларов за миллион выходных токенов GPT-5.4, а Anthropic – 25 долларов за Claude Opus 4.6.

В DeepSeek честно признают, что V4 "немного уступает" закрытым моделям – разрыв оценивается примерно в три-шесть месяцев разработки. При этом по агентному программированию и бенчмаркам на рассуждение V4 превосходит все остальные открытые модели на рынке.

Предыдущая модель V3 обучалась на 2048 ускорителях Nvidia H800. Компания неоднократно становилась объектом расследований относительно возможного приобретения санкционного оборудования Nvidia через посредников в Сингапуре. V4 эту цепочку поставок полностью обходит – обучение прошло на отечественных чипах Ascend.

В DeepSeek также сообщили, что цена V4-Pro может снизиться после того, как Huawei нарастит производство Ascend 950 во второй половине года.

По информации Reuters, дипломатическая телеграмма требует от сотрудников посольств обсуждать с иностранными коллегами "обеспокоенность извлечением и дистилляцией" моделей США "противниками". В числе названных в документе компаний оказались DeepSeek, Moonshot AI и MiniMax. За два дня до этого Управление научно-технической политики Белого дома опубликовало сообщение, в котором обвинило китайские структуры в проведении "целенаправленных кампаний промышленного масштаба" по дистилляции американских передовых ИИ-моделей.

Обвинения опираются на февральские заявления Anthropic. Тогда компания сообщила, что DeepSeek, Moonshot и MiniMax использовали 24 000 поддельных аккаунтов, чтобы провести 16 миллионов обменов с моделью Claude. OpenAI также обвиняла DeepSeek в дистилляции своих моделей.

Министерство иностранных дел Китая назвало обвинения "безосновательными", сообщает Reuters. В самой DeepSeek ранее настаивали, что V3 обучалась на естественно собранных данных и не использовала синтетические данные, сгенерированные OpenAI.

Дипломатическая телеграмма и анонс V4 совпали по времени неслучайно. До запланированного визита президента Дональда Трампа к председателю КНР Си Цзиньпину в Пекине остаётся всего несколько недель. Главными темами саммита, как ожидается, станут экспортные ограничения на полупроводники и споры об интеллектуальной собственности.

Больше статей на Shazoo
Тэги:

Об авторе

Эксперт по Fallout
Главный редактор
Более 16 лет в индустрии освещения видеоигр, кино, сериалов, науки и техники. Особенно разбираюсь в серии Fallout, ценитель The Elder Scrolls. Поклонник Arcanum и Fallout Tactics. Больше всего играю в Civilization, Old World и градостроители. Изучаю ИИ и загадки космоса.