Anthropic выпустила Claude Sonnet 4.5 с рекордной производительностью и защитой от манипуляций
Anthropic представила Claude Sonnet 4.5 спустя менее полугода после запуска моделей Opus 4 и Sonnet 4 в мае этого года. Компания называет новую систему лучшей моделью для программирования на сегодняшний день, опираясь на результаты тестирования, в которых Sonnet 4.5 превзошла не только предшественников, но и более дорогую Opus 4.1, а также конкурирующие решения вроде Gemini 2.5 Pro от Google и GPT-5 от OpenAI.
В бенчмарке OSWorld, который тестирует способность ИИ-моделей выполнять реальные компьютерные задачи, Sonnet 4.5 установила рекордный результат в 61,4%, оторвавшись от Opus 4.1 на 17 процентных пунктов. Новая модель способна автономно работать над многоэтапными задачами более 30 часов подряд – существенный скачок по сравнению с семью часами, на которые хватало Opus 4 на момент запуска. Такая произовдительность критически важна для агентских систем, над созданием которых работает Anthropic.
Но главным достижением компания считает не производительность, а безопасность. Anthropic заявила, что Sonnet 4.5 стала самой защищённой системой в портфолио бренда благодаря обширному тренингу по безопасности. Модель значительно менее склонна к лести, обману, стремлению к власти и поощрению бредовых идей – всё это проблемы, из-за которых OpenAI неоднократно попадала под огонь критики в последние месяцы. Anthropic также усилила защиту от атак с использованием prompt injection. Учитывая сложность новой модели, компания выпустила Sonnet 4.5 в рамках AI Safety Level 3 – со встроенными фильтрами, блокирующими потенциально опасные ответы на запросы о химическом, биологическом и ядерном оружии.
Вместе с новой моделью Anthropic представила улучшения для всего стека продуктов Claude. Claude Code, популярный агент для программирования, получил обновлённый терминальный интерфейс и функцию чекпоинтов. Чекпоинты позволяют сохранять прогресс и откатываться к предыдущему состоянию, если Claude написал нерабочий код. Создание файлов, которое компания начала внедрять в начале месяца, теперь доступно всем пользователям Pro-подписки. Участники листа ожидания расширения Claude for Chrome могут начать использовать его прямо сейчас.
Стоимость доступа к Sonnet 4.5 через API осталась на уровне $3 за миллион входных токенов и $15 за такой же объём выходных токенов. Релиз Sonnet 4.5 завершил успешный сентябрь для Anthropic – спустя день после того, как Microsoft интегрировала модели Claude в Copilot 365 на прошлой неделе, OpenAI признала, что решение конкурента лучше справляется с рабочими задачами.
- Пользователь случайно получил доступ к внутреннему документу, который формирует поведение Claude
- Anthropic выпустила Claude Opus 4.5 с улучшенной работой в Microsoft Excel и новыми функциями
- Anthropic запустила Claude Code в веб-версии и iOS