ИИ-модель Mythos может расколоть мир ИИ на избранных и всех остальных

Anthropic во вторник представила новую модель класса Mythos под названием Claude Fable 5, описав её как самую мощную модель из всех, которые ранее были доступны широкой публике.

Это значительно более укрощённая версия Mythos, гигантской модели, анонсированной Anthropic ещё в апреле, но до сих пор не выпущенной из-за её предполагаемой способности находить и эксплуатировать уязвимости в кибербезопасности.

Если пользователи спрашивают Fable 5 о потенциально чувствительных темах вроде кибербезопасности, биологии или химии, модель вежливо отказывается отвечать и автоматически переключается на более раннюю модель – Opus 4.8.

Практически сразу после релиза пользователи начали жаловаться, что защитные ограждения Fable слишком чувствительные, отказываясь отвечать на порой комично безобидные запросы.

Задайте модели вопрос уровня домашнего задания по биологии для третьеклассника, и она вполне может расценить это как красный флаг, словно вы планируете создать биологическое оружие. Эта гиперчувствительность заложена в модель намеренно, и Anthropic заранее предупредила, что часть безобидных запросов будет помечена как опасные.

Anthropic написала в блоге, посвящённом релизу Fable 5 и более мощной модели с ограниченной доступностью под названием Mythos 5:

Чтобы выпустить модель одновременно безопасно и быстро, мы настроили эти механизмы защиты консервативно. С приходом более способных моделей в ближайшие месяцы мы работаем над улучшением защитных механизмов и сокращением ложных срабатываний так быстро, как только можем.

В ветке на Reddit, появившейся через несколько часов после релиза Fable, начали накапливаться жалобы разработчиков на чрезмерно нервные защитные механизмы модели. Один написал:

Прямо сейчас совершенно непригодна к использованию. Надеюсь, Anthropic ослабит ограждения через неделю-другую.

Это перекликается с критикой, которая недавно появилась в сети после того, как Anthropic выпустила обновление "честности" для Opus 4.8, сделав модель чуть слишком непреклонной в приверженности правде на вкус некоторых пользователей.

В обоих случаях это напоминание о том, что попытки разработчиков ИИ найти идеальный тон в стиле общения моделей всегда будут отталкивать и раздражать кого-то, отсюда и движение к более персонализируемым чат-ботам, которое мы наблюдаем у некоторых крупных ИИ-лабораторий.

Сжигание токенов

Гнев, направленный на Fable, касается не только "личности" чат-бота, но и денег. Все эти безобидные запросы, которые Fable ошибочно отклоняет, всё равно стоят пользователям токенов, а цена этих токенов выше, чем когда-либо – новая модель оказалась в два раза дороже Opus 4.8.

В объявлении во вторник Anthropic специально позиционировала Fable как эксперта в более длительных, более "агентных" задачах. Но когда разработчики начали запускать модель на более интенсивные проекты по программированию, некоторые были неприятно удивлены тем, насколько быстро они сжигают лимиты токенов, предоставляемые их подписками.

Один пользователь Reddit, подписанный на тариф Max 20x за 200 долларов в месяц, написал:

Я наблюдал, как моё использование росло примерно на 2% в минуту. Не в час. В минуту.

Длительная агентная сессия съедала бы весь лимит использования токенов ещё до обеда. Для контекста: я никогда даже близко не подходил к лимитам с Opus 4.8, выполняя тот же тип работы.

Fable доступна по тарифам Pro, Max, Team и корпоративным планам без дополнительной платы, заявила Anthropic. Иными словами, индивидуальные разработчики и команды, подписанные на эти тарифы, теперь имеют доступ к Fable через те же лимиты токенов, за которые они уже платят, но эти лимиты будут достигаться гораздо быстрее из-за огромных вычислительных требований Fable.

Имущие и неимущие

Нынешняя подписочная доступность Fable будет заменена моделью "плати по факту использования" с 23 июня, по данным Anthropic. Это означает, что любой разработчик или организация, желающие использовать Fable, должны будут начать платить за кредиты использования.

Это пробуждает страхи перед надвигающимся разрывом в производительности между разработчиками и компаниями с достаточно глубокими карманами, чтобы позволить себе ведущие в индустрии возможности Fable (и моделей-преемников), и теми, у кого более скромные бюджеты и кто будет вынужден использовать более дешёвые, медленные и ограниченные модели.

Опасение заключается в том, что как только этот разрыв начнёт формироваться между имущими и неимущими, он будет расширяться со скоростью, эквивалентной эволюции самих моделей, возможно, экспоненциально.

С одной стороны окажется суперкласс с поддержкой ИИ, а с другой – постоянный низший класс.

Один из пользователей X написал:

У постоянного низшего класса, о котором все постоянно твитят, теперь есть дата старта: 23 июня.

Похожий аргумент подпитывает недовольство Anthropic в связи с так называемым Project Glasswing – программой, через которую Mythos (это Fable без защитных ограждений) медленно и постепенно разворачивается среди групп ранних тестировщиков. Идея в том, что благодаря медленному масштабированию компания может картировать и подготовиться к новым угрозам кибербезопасности, исходящим от модели.

По крайней мере для некоторых людей Project Glasswing – это ранний взгляд на будущее, в котором доступ к самым мощным моделям ИИ будет делегирован исключительно небольшой группе сверхбогатых организаций, обладающих самыми передовыми системами кибербезопасности. Опять же, всем остальным придётся довольствоваться упрощёнными альтернативами вроде Fable 5.

Но хотя Anthropic выделила соображения безопасности как основную причину сохранения Mythos для относительно небольшого числа клиентов, вполне вероятно, что вычислительные ограничения играют как минимум столь же важную роль в стратегии развёртывания.

Использование моделей вроде Fable, конечно, стоит токенов для пользователей, но также стоит и разработчикам, стоящим за ними, как для обучения (создания новых версий модели), так и для инференса (запуска существующих моделей).

Внезапный всплеск разработчиков, использующих Fable для длительных, сложных задач вроде создания целых сайтов или приложений, может создать реальное вычислительное узкое место для Anthropic, что делает необходимым развёртывание отмеренными этапами.

В этом свете предстоящий переход компании на модель оплаты по факту использования для Fable становится более понятным.

Как выразился один пользователь Reddit в среду, "давать всем неограниченный доступ к самой дорогой модели имеет примерно столько же смысла, как давать каждому клиенту неограниченные полёты на частном самолёте, потому что он оплатил членство в авиакомпании".

Больше статей на Shazoo
Тэги:

Об авторе

Эксперт по Fallout
Главный редактор
Более 16 лет в индустрии освещения видеоигр, кино, сериалов, науки и техники. Особенно разбираюсь в серии Fallout, ценитель The Elder Scrolls. Поклонник Arcanum и Fallout Tactics. Больше всего играю в Civilization, Old World и градостроители. Изучаю ИИ и загадки космоса.