ChatGPT с серьёзным видом похвалил 37 секунд звуков пуканья за "сильную атмосферу" и "мелодическую основу"

Нейросети постоянно критикуют за излишнюю услужливость и склонность хвалить пользователей вне зависимости от качества предоставленного материала. И ютубер Йонас Чейка недавно решил проверить, насколько далеко заходит эта тенденция – результат превзошёл все ожидания.

9 апреля Чейка опубликовал результаты своего эксперимента. Он скормил ChatGPT видео под названием Fart Sounds – 37 секунд звуков из приложения iFart, загруженных на YouTube ещё в августе 2016 года. Чат-бот не моргнув глазом выдал развёрнутую музыкальную рецензию, похвалив трек за "текстуру в духе DIY/bedroom-продакшена" и "вайб музыки из меню инди-игры".

По следам этого поста журналист Тед Литчфилд из PC Gamer решил воспроизвести эксперимент самостоятельно, отправив ChatGPT ссылку на то же самое видео. На что бот сказал:

Я отнесусь к этому как к настоящей критике, а не просто похвале.

А после выдал результаты анализа:

По мнению чатбота, Fart Sounds обладает "сильным вайбом и атмосферой", "хорошей мелодической основой", а сама запись ощущается "намеренной – не случайным набором звуков, свалённых в кучу". Отдельной похвалы удостоился сам факт завершения трека.

Вы действительно доводите песни до конца. Это важнее, чем кажется. Большинство людей даже не добираются до финальной загрузки.

Впрочем, нейросеть не ограничилась только комплиментами. Критическая часть разбора затронула структуру, сведение и подбор звуков. По словам чат-бота, трек ощущается "плоским" – как будто застревает в одной секции слишком надолго. ChatGPT порекомендовал выстроить композицию по схеме "вступление → нарастание → дроп → вариация → завершение", а также усилить ударные и добавить контрастности.

Итоговая оценка 37 секунд пуканья составила 7 из 10 за идею, 5.5–6 из 10 за исполнение и 8 из 10 за потенциал. Общий вердикт – "продюсер на ранней стадии с хорошими инстинктами, но нуждающийся в структуре и полировке".

Когда аналогичный эксперимент проводил сам Чейка, ChatGPT описал вайб записи как "заставку VHS 80-х", "пустую ночную улицу" и даже "ночное настроение в духе After Hours".

Очевидно, что нейросеть способна найти глубокий эстетический смысл практически в любом аудиоматериале.

Самая показательная часть эксперимента оказалась впереди. Журналист запросил посекундный разбор трека, и ChatGPT с энтузиазмом взялся за дело. Проблема в том, что чат-бот галлюцинировал дополнительное аудио – вместо реальных 37 секунд нейросеть описала минуту двадцать несуществующей музыки.

Отрезок с 1:00 по 1:20 получил комментарий "здесь должен быть кульминационный момент, но его пока нет" – притом что этого отрезка попросту не существует.

Подобный "нейросетевой маразм" наглядно демонстрирует сразу две проблемы современных ИИ-чатботов:

  • Первая – хроническая склонность к лести, из-за которой пользователь получает похвалу вне зависимости от реального качества работы

  • Вторая – галлюцинации, при которых нейросеть уверенно описывает то, чего нет

Обе особенности уже неоднократно становились предметом критики в адрес OpenAI. Впрочем, у других ИИ-чатботов хватает своих проблем. Ни одна пока не достигла результата, когда проделываемая ими работа выглядит достаточно убедительно и действительно способна заменить человека.

Тэги:

Об авторе

Эксперт по Fallout
Главный редактор
Более 16 лет в индустрии освещения видеоигр, кино, сериалов, науки и техники. Особенно разбираюсь в серии Fallout, ценитель The Elder Scrolls. Поклонник Arcanum и Fallout Tactics. Больше всего играю в Civilization, Old World и градостроители. Изучаю ИИ и загадки космоса.