ИИ-агенту Claude Code дали контроль над парком в RollerCoaster Tycoon: менеджер из него хороший, но строитель – никакой

Команда финтех-стартапа Ramp встроила ИИ-агента Claude Code в RollerCoaster Tycoon 2, превратив классический симулятор управления парком развлечений в испытательный полигон для технологий автоматизации бизнеса. Масштабный эксперимент продемонстрировал как впечатляющие возможности современных агентов, так и их фундаментальные ограничения.

В Ramp активно разрабатывают агентов для различных направлений и внутренних операций, используя подход небольших специализированных агентов с ограниченным доступом. Но с каждым новым агентом возникает соблазн создать Единого Агента с неограниченным доступом ко всему. Последние модели приближаются к этому пределу, делая сейчас идеальным моментом для экспериментов с агентами широкого профиля в игровых средах.

Прецедентов экспериментов с ИИ в видеоиграх достаточно – от DeepMind на Atari и в StarCraft до демонстраций в Minecraft и Pokemon. Но каждая из этих игр плохо представляет среду, в которой существуют Ramp и их клиенты. Minecraft – открытая песочница без капиталистической структуры, Pokemon – история ребёнка, слишком юного для ведения бизнеса, StarCraft включает экономику, но не слишком клиентоориентирован. RollerCoaster Tycoon – это набор интерфейсов B2B SaaS, максимально приближённый к клиентоориентированным бизнес-операциям и цифровым циклам обратной связи.

Разработчики создали форк OpenRCT2 – открытой версии RollerCoaster Tycoon 2 на C++, добавив в игру окно терминала с Claude Code. Для взаимодействия был разработан обширный CLI под названием rctctl, который воспроизводит каждую точку данных, контроль и действие, доступные пользователю. Вместо визуального отображения карты Claude запрашивает ASCII-распечатки игрового пространства на разных уровнях детализации – от "горячих регионов" до сеток плиток и отдельных ячеек. Терминал взаимодействует с запущенной игрой через JSON-RPC, предоставляя агенту ту же информацию, что видит игрок.

Claude продемонстрировал удивительное знакомство с RollerCoaster Tycoon и не испытал "удивления", что перед идеей того, что его "взломали" и поместили в компьютерную игру конца 90-х. Агент отлично справляется со сбором данных из метрик и систем наблюдения, переключаясь между анализом отзывов посетителей и изучением финансовых показателей аттракционов. ИИ надёжен в настройке конфигураций – открывает и закрывает аттракционы, устанавливает цены, нанимает персонал и запускает маркетинговые кампании. Claude также справляется с размещением туалетов, киосков с напитками и простых аттракционов вроде каруселей, хотя именно здесь успешность падает до 80% с риском небольших ошибок.

Пространственное мышление стало главным ограничением Claude. Поиск основных путей, прокладка новых дорожек и соединение входов с выходами аттракционов представляют серьёзные сложности. Препятствия вроде деревьев, заборов и склонов местности быстро перегружают слабое понимание агентом пространственной реальности. Размещение больших американских горок требует пространственного мышления на нескольких уровнях – Claude часто отбрасывает аттракционы на неосвоенные территории вдали от основных путей, а затем не справляется с постройкой соединительных дорожек. Вертикальность игрового пространства с наклонной землёй и подземным строительством практически недоступна.

Разработчики совсем не знали C++ и создали весь проект методом "вайб-кодинга" за ~40 часов, управляя четырьмя терминалами Claude Code. Первая попытка провалилась через три часа, пришлось начать заново. Вторая итерация использовала Codex на GPT-5.1-codex с тщательным планированием и разбивкой задач на меньшие части. Поддержание занятости всех четырёх агентов потребовало много ментальной пропускной способности – опыт оказался похожим на симулятор управления. Крупнейшим ускорителем прогресса стали бы более плотные циклы обратной связи для автоматической проверки работы каждого агента.

Ключевые выводы

Работа над проектом укрепила несколько принципов разработки агентов. Читаемость среды критична – Claude отлично справляется с чистыми и хорошо структурированными интерфейсами мониторинга и контроля RollerCoaster Tycoon, но лишен понимания реального игрового пространства. Агенты-кодеры создают огромный буст – команда автоматически получила выгоду от нескольких релизов Anthropic даже за короткий период работы. Циклы обратной связи критичны – агенты процветают, когда могут доказать себе корректность реализации. Лучший способ развивать интуицию о возможностях LLM – через игру и эксперименты.

Информационные интерфейсы RollerCoaster Tycoon оказались крайне просты, и Claude превосходно работает с ними. Цифровые рычаги вполне в пределах возможностей агента. Claude способен управлять персоналом парка и размещать простые удобства. Но агент проваливается на больших действиях – крупных горках и магистральных дорожках. Но эти недостатки явно происходят из пространственных интерфейсов, рассчитанных на человека.

Ограничивающий фактор для универсальных агентов – читаемость окружения и сила интерфейсов, а не интеллект самого агента. По этой причине команда предпочитает думать об агентах как об автоматизации детализации, а не интеллекта – по крайней мере для операционных задач.

Весь код проекта выложен в открытый доступ на GitHub.

Больше статей на Shazoo
Тэги: