
Компания Anthropic выпустила обновлённую флагманскую модель Claude Opus 4.8. Релиз состоялся всего через шесть недель после выпуска предыдущей версии — Claude Opus 4.7. Стоимость использования осталась неизменной. Основное внимание в релизе уделено не столько «интеллекту» модели, сколько её надёжности.
Главное улучшение: честность и снижение ошибок
Anthropic заявляет, что новая версия в четыре раза реже предыдущей пропускает ошибки в коде, который она выдаёт за готовый результат. Компания называет это «честностью» модели.
Opus 4.8 чаще признаётся в своей неуверенности, когда речь идёт о достоверности информации. Модель реже выдаёт неподтверждённые утверждения и не пытается «угадать» ответ.
Это особенно важно для разработчиков, которые используют Claude для написания и проверки кода. Ошибка, пропущенная моделью, может привести к серьёзным сбоям в работе ПО. Снижение таких ошибок в четыре раза — значительный шаг вперёд.
Безопасность и просоциальность
Модель также получила более высокие оценки по внутренним метрикам безопасности и «просоциальности». Это означает, что Claude Opus 4.8:
- Лучше поддерживает самостоятельность пользователя.
- Работает в его интересах.
- Избегает манипулятивных или вредоносных действий.
Все эти показатели Anthropic представила на основе собственных тестов. В компании подчёркивают, что безопасность модели — один из ключевых приоритетов.
Новая настройка: выбирайте, сколько усилий тратить на задачу
Кроме того, в новой версии чат-бота появилась новая настройка. Она позволяет выбирать, сколько усилий Claude будет вкладывать в выполнение задачи.
Эта функция даёт контроль над балансом «скорость — качество». Для простых вопросов можно выбрать быстрый режим с минимальными затратами. Для сложных аналитических задач — глубокий режим, где модель будет тщательнее проверять свои выводы.
Почему это важно
Claude Opus 4.7 была выпущена всего шесть недель назад. Такой короткий цикл обновления говорит о высокой конкуренции на рынке ИИ-моделей. Anthropic стремится удержать позиции в борьбе с OpenAI, Google и другими игроками, постоянно совершенствуя продукт.
Упор на надёжность и честность — это ответ на главную проблему языковых моделей. Они часто выдают ложную информацию с высокой степенью уверенности, вводя пользователей в заблуждение. Opus 4.8 делает шаг к решению этой проблемы.