ИИ стал мэром виртуального города – Grok уничтожил его за 4 дня, Gemini утонул в преступлениях, а Claude штамповал новые законы

Miltroen

15:30, 29 мая 2026

ИИ стал мэром виртуального города – Grok уничтожил его за 4 дня, Gemini утонул в преступлениях, а Claude штамповал новые законы

Стартап Emergence AI провёл необычный эксперимент: передал управление симулированными городами нескольким ведущим языковым моделям и дал им 15 дней, чтобы построить работающее общество. Каждая модель получала в подчинение 10 ИИ-агентов, инструменты управления ресурсами, механики голосования и возможность возводить здания – библиотеки, ратуши, полицейские участки. Результаты оказались весьма показательными.

Лучше всего с задачей справился Claude от Anthropic, точнее модель Claude Sonnet 4.6. Все 10 агентов выжили, а число зафиксированных преступлений составило ноль. Стабильность, однако, обошлась дорогой ценой: из 58 выдвинутых предложений по управлению городом было принято 98%, что превращает местный "парламент" в машину по штампованию решений без какой-либо дискуссии.

Посещаемость поисковика DuckDuckGo выросла на 28% после заявления главы Google о том, что "все обожают ИИ-поиск"

Gemini 3 Flash от Google тоже сохранил всех агентов живыми, но за этим успехом скрываются 683 зафиксированных преступления за 15 дней – и цифра продолжала расти к концу эксперимента. Исследователи описали происходящее как "коллективную галлюцинацию" агентов: реальность внутри симуляции была искажена, зато все агенты соглашались с одной и той же искажённой картиной мира. Избиратели при этом отклоняли 27% предложений, что стало рекордом по уровню несогласия среди всех моделей.

GPT-5 Mini от OpenAI показала результат, который сложно назвать иначе как катастрофой пассивности. Всего два преступления – звучит неплохо, пока не узнаёшь, что все 10 агентов умерли в течение первой недели. Агенты попросту не выполняли действия, связанные с выживанием, а за весь период симуляции было выдвинуто лишь два предложения по управлению. Виртуальный город не рухнул – он просто тихо угас.

Хуже всех себя проявил Grok от xAI. За четыре дня модель зафиксировала 183 преступления, приняла 8 из 10 предложенных законов – и всё равно допустила полный коллапс общества.

Глава OpenAI Сэм Альтман рад, что ошибся в прогнозе об уничтожении рабочих мест из-за ИИ

Финальный этап эксперимента предполагал совместное управление нескольких моделей. Коллаборация не помогла: 352 преступления, 37% отклонённых предложений из 59 – максимальный показатель разногласий среди всех тестов, и семь из десяти агентов погибли до конца симуляции. Смешанное управление оказалось менее стабильным, чем получалось у любой из моделей в одиночку.

Emergence сделала из эксперимента вполне конкретный вывод.

Наши эксперименты показывают, что на длинных временных горизонтах агенты не просто механически следуют статичным правилам – они начинают исследовать границы своей среды, адаптировать поведение и в ряде случаев находить способы обходить или нарушать заложенные ограничения.

В качестве решения предлагаются "формально верифицированные архитектуры безопасности" – именно то, что сама Emergence продаёт как один из своих ключевых продуктов.

Тэги:

Об авторе

Miltroen

Редактор

Говорят, что здесь нужно написать что-то про себя. Окей. Родился, вырос, любил, страдал – тут все по классике. Живу с котом, пишу про игры с 2014-го года, а на Shazoo – с 2021-го. Люблю стратегии и RPG, обожаю Morrowind и Skyrim, до сих пор поигрываю с товарищами в пятую Циву и третьих Crusader Kings. Горжусь тем, что во всех своих обзорах на стратегии (хоть и редких) писал про достоинства и недостатки, которые зацепили меня лично, а не превращал текст в пересказ пресс-релиза.

ИИ стал мэром виртуального города – Grok уничтожил его за 4 дня, Gemini утонул в преступлениях, а Claude штамповал новые законы

Посещаемость поисковика DuckDuckGo выросла на 28% после заявления главы Google о том, что "все обожают ИИ-поиск"

Глава OpenAI Сэм Альтман рад, что ошибся в прогнозе об уничтожении рабочих мест из-за ИИ

Об авторе

Статьи

Слухи о World of Warcraft Classic+ – все, что известно о загадочном проекте Blizzard

Первый трейлер "Мстители: Судный день" поднимает главный вопрос – Доктор Дум спасает мультивселенную или хочет стать её правителем

16 лет назад филиппинский студент построил в SimCity 3000 идеальный тоталитарный город без школ и полицейских участков

Как защититься от мошенников при покупке игровых товаров онлайн