Anthropic выпустила Claude Opus 4.8 и анонсировала модели класса Mythos

Anthropic представила Claude Opus 4.8, самую продвинутую версию своей флагманской ИИ-модели. Новинка доступна везде по той же цене, что и предшественник Opus 4.7, по 5 долларов за миллион входных токенов и 25 долларов за миллион выходных.

По заявлению компании, Opus 4.8 демонстрирует лидирующие в индустрии показатели в задачах агентного программирования и агентного использования компьютера, что стало стандартом для новых моделей Anthropic. Ключевым отличием, на котором делает акцент сама компания, стала "честность" модели и, как следствие, её общая надёжность.

Согласно записи в блоге Anthropic, Opus 4.8 специализируется на обнаружении собственных ошибок и информировании о них пользователей.

Общая проблема ИИ-моделей заключается в том, что они иногда делают поспешные выводы, уверенно заявляя о достигнутом прогрессе в работе, несмотря на скудные доказательства. Ранние тестировщики сообщают, что Opus 4.8 чаще указывает на неопределённость в своей работе и реже делает необоснованные заявления.

Майкл Ран, старший инвестиционный аналитик управляющей активами компании Bridgewater, в блоге Anthropic отметил, что Opus 4.8 смог "проактивно выявлять проблемы во входных и выходных данных анализа, что другие модели регулярно упускали, оставляя это на усмотрение пользователей".

Opus 4.8 также представляет "существенно более низкий" риск несогласованного и опасного поведения, включая генерацию вредного сексуального контента и "подрыв либеральной демократии", согласно системной карточке модели.

Помимо новой модели, Anthropic анонсировала запуск "динамических рабочих процессов", новой функции в формате исследовательского превью, которая позволяет Claude справляться с более сложными задачами программирования путём развёртывания сотен субагентов, способных работать параллельно друг другу.

Пользователи могут ожидать заметного улучшения от Opus 4.8, особенно для крупных задач программирования, но это не революция. Anthropic даже попыталась умерить ожидания, написав в блоге, что Opus 4.8 представляет собой "скромное, но ощутимое улучшение по сравнению с предшественником" Opus 4.7.

Та модель дебютировала чуть более месяца назад и получила прохладный отклик пользователей, некоторые из которых жаловались, что функция "адаптивного мышления" иногда заставляла её тратить слишком много времени на простые задачи и недостаточно на те, что требуют больших усилий.

Возможно, в прямом ответе на эту жалобу Anthropic также объявила о запуске новой панели "контроля усилий" для Claude, которая находится в выпадающем меню выбора модели и позволяет вручную выбирать количество усилий и токенов, которые модель потратит на конкретную задачу.

По умолчанию установлено значение "Low", и его можно переключить на "Medium", "High" или "Max", либо включить режим адаптивного мышления.

Anthropic также намекнула на предстоящий дебют "нового класса моделей" с возможностями, якобы сопоставимыми с Mythos. Компания пока не выпустила эту модель публично, ссылаясь на её беспрецедентную мощь и риски кибербезопасности.

Согласно новой записи в блоге, Anthropic работает над тестированием защитных мер для Mythos и ожидает выпуска "моделей класса Mythos для всех наших клиентов в ближайшие недели". Формулировка предельно расплывчатая, вероятно, намеренно.

Пока неясно, оправдают ли новые модели слухи, циркулирующие вокруг Mythos, или окажутся существенно ослабленной версией оригинального гиганта. Разработчики ИИ склонны раздувать возможности и опасности своих моделей до релиза, и в большинстве случаев реальность не соответствует ожиданиям.

Достаточно вспомнить ажиотаж вокруг GPT-5 как якобы AGI.

Больше статей на Shazoo
Тэги:

Об авторе

Эксперт по Fallout
Главный редактор
Более 16 лет в индустрии освещения видеоигр, кино, сериалов, науки и техники. Особенно разбираюсь в серии Fallout, ценитель The Elder Scrolls. Поклонник Arcanum и Fallout Tactics. Больше всего играю в Civilization, Old World и градостроители. Изучаю ИИ и загадки космоса.