Новая ИИ-модель с открытым кодом от Nvidia способна конкурировать с GPT-4
Nvidia выпустила мощную открытую модель искусственного интеллекта, которая может составить конкуренцию таким гигантам, как GPT-4 от OpenAI и решения Google. Новое семейство моделей NVLM 1.0, возглавляемое мультимодальной моделью с 72 миллиардами параметров NVLM-D-72B, демонстрирует выдающиеся результаты как в задачах в области визуальных и языковых навыков, так и в текстовых задачах.
Мы представляем NVLM 1.0 — семейство мультимодальных больших языковых моделей передового уровня, которые достигают лучших результатов в задачах на пересечении языка и зрения, конкурируя с ведущими проприетарными моделями (например, GPT-4) и открытыми моделями.
— Nvidia
Ключевым моментом стало то, что Nvidia делает веса модели доступными, а также обещает выпустить код для ее обучения. Это решение выделяется на фоне закрытых систем от конкурентов и дает исследователям и разработчикам доступ к передовым технологиям.
NVLM-D-72B отличается высокой адаптивностью и способностью обрабатывать как визуальные, так и текстовые данные. Модель может интерпретировать мемы, анализировать изображения и пошагово решать математические задачи. Особенно примечательно, что ее производительность в текстовых задачах улучшается после мультимодального обучения.
Один из исследователей заметил относительно этого релиза:
Поразительно! Nvidia только что опубликовала модель с 72 миллиардами параметров, которая почти на уровне Llama 3.1 с 405 миллиардами в математических и кодинговых тестах, и еще с поддержкой зрения!
Этот шаг Nvidia может ускорить исследования и разработки в области ИИ, позволяя менее крупным организациям и независимым исследователям вносить значительный вклад в развитие технологий. Проект NVLM также включает инновационные архитектурные решения, такие как гибридный подход к обработке мультимодальных данных, который может задать новые направления исследований в области ИИ.
Открытая публикация такой мощной модели может оказать серьезное влияние на индустрию, вынуждая другие компании пересмотреть свои подходы к разработкам и доступности ИИ. В то же время, данный шаг также вызывает вопросы о рисках, связанных с более широким доступом к таким передовым технологиям — кто-то сможет использовать подобные модели со злым умыслом.
- Nvidia открыла исходный код RTX Remix и добавила Rest API с интеграцией ComfyUI для ИИ-ремастеринга и генерации новой графики в реальном времени
- Nvidia стала самой ценной компанией в мире — цена за акцию превысила 135 долларов
- Nvidia стала дороже Apple с рыночной капитализацией в $3,01 трлн