ИИ поможет точнее распознавать человеческую речь

ИИ поможет точнее распознавать человеческую речь

Современные технологии распознавания речи в значительной степени ошибаются. Для описания объекта требуется большое количество аннотаций и транскрипций, чтобы помочь системе понять, на что ссылается пользователь. Для избежания сложности понимания между человеком и машиной учёные разработали систему машинного обучения.

Команда начала с подхода, при котором две нейронные сети обрабатывают одновременно изображение и звуковые спектрограммы. На основе машинного обучения оба направления учатся понимать друг друга, чтобы лучше идентифицировать объект на основе голоса. По словам учёные, это больше похоже на то, как взрослые объясняют ребёнку что-либо, указывая на объект пальцем и описывая его.

Существующая модель была сильно модифицирована. Такая нейросеть разделяет изображение на ячейки памяти, а речь на двухсекундные аудио-отрезки. После чего накладывает одно на другое. Таким образом ИИ обучается за счёт постоянных сопоставлений. 

Видео от Shazoo

Подписаться

4 Комментария

  • beecool
    Комментарий скрыт. Показать

    А там глядишь, восстание умных машин не за горами)

    0
  • Комментарий скрыт. Показать

    Забавно вспоминать, как пару лет назад всё что мы знали о нейронных сетях, это то, что они рисуют странные картины. А теперь на них все молятся.

    1
  • Shazec
    Комментарий скрыт. Показать

    Иммитация ии на основе слабых кремниевых чипах, но направление пугающее, что можно будет достичь на основе иной формы вычислений трудно предположить. Это минимум эволюционный скачок человечества.

    0
  • Yoshimitsu818
    Комментарий скрыт. Показать

    @beecool, скорее "1984" не за горами :)

    0
Войдите на сайт чтобы оставлять комментарии.