ИИ стал мэром виртуального города – Grok уничтожил его за 4 дня, Gemini утонул в преступлениях, а Claude штамповал новые законы
Стартап Emergence AI провёл необычный эксперимент: передал управление симулированными городами нескольким ведущим языковым моделям и дал им 15 дней, чтобы построить работающее общество. Каждая модель получала в подчинение 10 ИИ-агентов, инструменты управления ресурсами, механики голосования и возможность возводить здания – библиотеки, ратуши, полицейские участки. Результаты оказались весьма показательными.
Лучше всего с задачей справился Claude от Anthropic, точнее модель Claude Sonnet 4.6. Все 10 агентов выжили, а число зафиксированных преступлений составило ноль. Стабильность, однако, обошлась дорогой ценой: из 58 выдвинутых предложений по управлению городом было принято 98%, что превращает местный "парламент" в машину по штампованию решений без какой-либо дискуссии.
Gemini 3 Flash от Google тоже сохранил всех агентов живыми, но за этим успехом скрываются 683 зафиксированных преступления за 15 дней – и цифра продолжала расти к концу эксперимента. Исследователи описали происходящее как "коллективную галлюцинацию" агентов: реальность внутри симуляции была искажена, зато все агенты соглашались с одной и той же искажённой картиной мира. Избиратели при этом отклоняли 27% предложений, что стало рекордом по уровню несогласия среди всех моделей.
GPT-5 Mini от OpenAI показала результат, который сложно назвать иначе как катастрофой пассивности. Всего два преступления – звучит неплохо, пока не узнаёшь, что все 10 агентов умерли в течение первой недели. Агенты попросту не выполняли действия, связанные с выживанием, а за весь период симуляции было выдвинуто лишь два предложения по управлению. Виртуальный город не рухнул – он просто тихо угас.
Хуже всех себя проявил Grok от xAI. За четыре дня модель зафиксировала 183 преступления, приняла 8 из 10 предложенных законов – и всё равно допустила полный коллапс общества.
Финальный этап эксперимента предполагал совместное управление нескольких моделей. Коллаборация не помогла: 352 преступления, 37% отклонённых предложений из 59 – максимальный показатель разногласий среди всех тестов, и семь из десяти агентов погибли до конца симуляции. Смешанное управление оказалось менее стабильным, чем получалось у любой из моделей в одиночку.
Emergence сделала из эксперимента вполне конкретный вывод.
Наши эксперименты показывают, что на длинных временных горизонтах агенты не просто механически следуют статичным правилам – они начинают исследовать границы своей среды, адаптировать поведение и в ряде случаев находить способы обходить или нарушать заложенные ограничения.
В качестве решения предлагаются "формально верифицированные архитектуры безопасности" – именно то, что сама Emergence продаёт как один из своих ключевых продуктов.
- Grok стал одним из элементов ИИ-арсенала Пентагона
- Пользователь случайно получил доступ к внутреннему документу, который формирует поведение Claude
- ИИ-бот Grok выбрал уничтожение евреев вместо испарения мозга Илона Маска