Яндекс выпустил библиотеку YaFSDP для ускорения обучения языковых моделей

Коэн (NoW)

15:30, 13 июня 2024

Яндекс разработал и представил доступ к исходному коду библиотеку YaFSDP, которая ускоряет обучение больших языковых моделей до 25%. Библиотека оптимизирует использование ресурсов графических процессоров (GPU), снижая их расход на 20%. Это позволит разработчикам и исследователям по всему миру эффективнее обучать нейросети.

YaFSDP решает проблему недостаточной загрузки каналов коммуникации между GPU, оптимизируя их использование на всех этапах обучения, включая предварительное, с учителем (supervised fine-tuning) и выравнивание модели (alignment). Это делает обучение более экономичным и быстрым, что особенно важно для стартапов и научных проектов.

Яндекс уже протестировал YaFSDP на сторонних нейросетях, например, на модели LLaMA 2, где время обучения сократилось с 66 до 53 дней при использовании 1024 GPU. Исходный код библиотеки доступен на GitHub, где можно ознакомиться с подробностями её работы и результатами тестирования.

Больше статей на Shazoo

Новые патенты Take-Two указывают на возможное использование ИИ для оживления NPC и города в GTA 6
ИИ-выступление Джорджа Карлина оказалось написано человеком — но это не спасло авторов от судебного иска
СМИ: iOS 18 станет одним из крупнейших обновлений в истории iPhone

Тэги:

Читать комментарии на сайте

Яндекс выпустил библиотеку YaFSDP для ускорения обучения языковых моделей

Статьи

Новая информация и скриншоты Dragon Age: The Veilguard — кастомизация, исследование, компаньоны и подробный взгляд на базу игрока

Краткий разбор и скриншоты со стрима Civilization 7 — взгляд на античность

Знакомство с телевизором Hisense U7NQ Mini-LED PRO

Как получить доступ к бета-тестированию Sacralium, и чего ожидать