Google Translatotron переводит речь пользователя его же голосом
Google представила первый в мире инструмент Translatotron, который переводит речь с одного языка на другой, сохраняя при этом голос говорящего. Компания надеется, что данная разработка поможет освоить новые модели прямого перевода.
Translatotron использует сетевую модель "последовательность-последовательность", которая принимает голос ввода, обрабатывает его как спектрограмму и генерирует новую на нужном языке. В результате получается более быстрый перевод с наименьшим количеством ошибок.
Прослушать результаты перевода с помощью Translatotron можно на странице GitHub.
Больше статей на Shazoo
- ИИ Gemini 1.5 от Google страдает от избытка повестки при генерации изображений
- СМИ: RuStore обогнал App Store по количеству заходов в приложение
- Google представила Gemini 1.5 Pro — новую, более эффективную ИИ-модель
Тэги: