Anthropic представила Claude Opus 4.8

Компания Anthropic выпустила обновлённую флагманскую модель Claude Opus 4.8. Релиз состоялся всего через шесть недель после выпуска предыдущей версии — Claude Opus 4.7. Стоимость использования осталась неизменной. Основное внимание в релизе уделено не столько «интеллекту» модели, сколько её надёжности.


Главное улучшение: честность и снижение ошибок

Anthropic заявляет, что новая версия в четыре раза реже предыдущей пропускает ошибки в коде, который она выдаёт за готовый результат. Компания называет это «честностью» модели.

Opus 4.8 чаще признаётся в своей неуверенности, когда речь идёт о достоверности информации. Модель реже выдаёт неподтверждённые утверждения и не пытается «угадать» ответ.

Это особенно важно для разработчиков, которые используют Claude для написания и проверки кода. Ошибка, пропущенная моделью, может привести к серьёзным сбоям в работе ПО. Снижение таких ошибок в четыре раза — значительный шаг вперёд.


Безопасность и просоциальность

Модель также получила более высокие оценки по внутренним метрикам безопасности и «просоциальности». Это означает, что Claude Opus 4.8:

  • Лучше поддерживает самостоятельность пользователя.
  • Работает в его интересах.
  • Избегает манипулятивных или вредоносных действий.

Все эти показатели Anthropic представила на основе собственных тестов. В компании подчёркивают, что безопасность модели — один из ключевых приоритетов.


Новая настройка: выбирайте, сколько усилий тратить на задачу

Кроме того, в новой версии чат-бота появилась новая настройка. Она позволяет выбирать, сколько усилий Claude будет вкладывать в выполнение задачи.

Эта функция даёт контроль над балансом «скорость — качество». Для простых вопросов можно выбрать быстрый режим с минимальными затратами. Для сложных аналитических задач — глубокий режим, где модель будет тщательнее проверять свои выводы.


Почему это важно

Claude Opus 4.7 была выпущена всего шесть недель назад. Такой короткий цикл обновления говорит о высокой конкуренции на рынке ИИ-моделей. Anthropic стремится удержать позиции в борьбе с OpenAI, Google и другими игроками, постоянно совершенствуя продукт.

Упор на надёжность и честность — это ответ на главную проблему языковых моделей. Они часто выдают ложную информацию с высокой степенью уверенности, вводя пользователей в заблуждение. Opus 4.8 делает шаг к решению этой проблемы.

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *