СМИ: OpenAI транскрибировала 1 миллион часов видео с YouTube для обучения GPT-4
По сообщению The New York Times, OpenAI предположительно транскрибировала более миллиона часов видео с YouTube для обучения GPT-4. Этот отчет появился всего через несколько дней после того, как генеральный директор YouTube Нил Мохан заявил в интервью Bloomberg, что использование видео с YouTube для обучения ИИ будет "явным нарушением" его политики.
В отчете The New York Times утверждается, что члены команды OpenAI, включая президента Грега Брокмана, лично помогали собирать видео с YouTube, согласно источникам. В статье подробно рассказывается о том, как OpenAI и многие технологические компании сталкиваются с трудностями при сборе достаточного количества данных для обучения массивных моделей ИИ. Предположительно, OpenAI использовала Whisper, свое программное обеспечение для транскрипции на основе ИИ, для сбора большего количества данных для обучения GPT-4, последней и лучшей модели, лежащей в основе ChatGPT.
Отчет The New York Times может иметь огромные последствия для продолжающейся битвы OpenAI и Google в отношении ИИ. Маловероятно, что Google будет молчать, если OpenAI использует ее контент, чтобы сделать ChatGPT еще лучше. Однако компания еще не выдвинула таких обвинений. В заявлении для The Verge на этих выходных представитель Google лишь сказал, что он "видел неподтвержденные сообщения" об обучении OpenAI.
Главный технический директор OpenAI Мира Мурати сказала, что она "не уверена", использовались ли видео с YouTube для обучения модели генеративного видео Sora, когда ее спросили об этом в The Wall Street Journal в марте. В отчете The New York Times ничего не говорится о Sora или самих фрагментах YouTube.
Сама The New York Times сейчас судится с OpenAI по авторским правам. OpenAI и Meta также судятся с рядом авторов и издателей из-за обучения ИИ на защищенных авторским правом произведениях.
Если эти сообщения окажутся верны, это может поднять совершенно новые вопросы об авторском праве в мире ИИ.
- OpenAI планирует разработку собственных ИИ-чипов на будущей 1.6 нм платформе TSMC A16
- ChatGPT удвоил количество еженедельных активных пользователей до 200 миллионов
- Исследование: Восемь из десяти проектов, связанных с ИИ, терпят неудачу, сжигая миллиарды финансирования