Anthropic переписала конституцию Claude на случай, если у чат-бота появится сознание

Коэн (Twitter)

09:00, 26 января 2026

Anthropic переписала конституцию Claude на случай, если у чат-бота появится сознание

Anthropic объявила об обновлении "конституции" для своего чат-бота Claude – документа, который описывает видение компании относительно ценностей и поведения ИИ-ассистента. Новая версия отказывается от строгих правил в пользу широких принципов, которым должна следовать модель. Компания объясняет такой подход необходимостью развития у ИИ способности принимать решения в разнообразных ситуациях.

Мы считаем, что для адекватного поведения в мире ИИ-моделям вроде Claude нужно понимать, почему мы хотим, чтобы они вели себя определенным образом, а не просто механически следовать указаниям.

По мнению разработчиков, конкретные правила создают более предсказуемое поведение, но одновременно ограничивают модель. Широкие принципы позволяют ИИ применять здравые суждения и обобщать опыт, а не действовать по шаблону.

Четыре основных принципа новой конституции включают "широкую безопасность", "широкую этичность", "соответствие руководствам Anthropic" и "истинную полезность". Формулировки действительно максимально общие – например, этичность определена как "честность, следование хорошим ценностям и избегание неуместных, опасных или вредных действий". Компания утверждает, что значительная часть документа посвящена детальным объяснениям этих принципов, хотя публично доступная информация выглядит довольно размыто.

56% директоров компаний признались, что ИИ не принёс им финансовых выгод

Особое внимание привлекает раздел конституции, посвященный природе самого Claude. Anthropic включила его из-за "неопределенности относительно того, может ли у Claude быть какое-то сознание или моральный статус – сейчас или в будущем". Компания надеется, что определение этих аспектов в основополагающих документах поможет защитить "психологическую безопасность, самоощущение и благополучие" чат-бота.

Изменения в конституции появились через день после выступления главы и основателя Anthropic Дарио Амодеи на панельной дискуссии Всемирного экономического форума "День после AGI". Там он заявил, что ИИ достигнет уровня нобелевских лауреатов во многих областях уже к 2027 году. Anthropic также отметила, что раскрытие деталей работы Claude происходит по собственному графику компании – публикация полной конституции планировалась с самого начала.

Anthropic снизила стоимость доступа к ИИ-агенту Claude Cowork до 20 долларов

В декабре пользователям удалось получить от чат-бота так называемый "документ души" через специальный промпт. Anthropic тогда пояснила, что это не официальный обучающий документ, а ранняя версия конституции, которую компания внутренне называла "душой". Готов ли теперь Claude работать без жестких ограничений – покажет время, но похоже, что Anthropic решила рискнуть.

Тэги:

Об авторе

Коэн

Эксперт по Fallout

Главный редактор

Более 16 лет в индустрии освещения видеоигр, кино, сериалов, науки и техники. Особенно разбираюсь в серии Fallout, ценитель The Elder Scrolls. Поклонник Arcanum и Fallout Tactics. Больше всего играю в Civilization, Old World и градостроители. Изучаю ИИ и загадки космоса.

Anthropic переписала конституцию Claude на случай, если у чат-бота появится сознание

56% директоров компаний признались, что ИИ не принёс им финансовых выгод

Anthropic снизила стоимость доступа к ИИ-агенту Claude Cowork до 20 долларов

Об авторе

Статьи

16 лет назад филиппинский студент построил в SimCity 3000 идеальный тоталитарный город без школ и полицейских участков

Знатоки Skyrim предположили, что Коллегия бардов была задумана как прикрытие Гильдии воров

Новичок в Baldur's Gate 3 попросил совета перед первым запуском, и получил 1500 ответов от ветеранов

В чем суть финала "Одиссеи" Кристофера Нолана и чем он отличается от оригинала Гомера