Anthropic представила Claude Sonnet 5: новая модель близка к Opus 4.8 и доступна по низкой цене

Добавь сайт в закладки! Инструкция по ссылке.

+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0

Claude Sonnet 5 более эффективно планирует, взаимодействует с браузером и терминалом, а также выполняет сложные многошаговые задачи практически без человеческого участия

Искусственный интеллект117:54

Anthropic представила Claude Sonnet 5 — новую языковую модель из семейства Claude, которая прежде всего нацелена на агентные сценарии использования. По словам разработчиков, модель получила значительные улучшения в аспектах планирования, взаимодействия с внешними инструментами, программирования и выполнения сложных многошаговых задач, приблизившись по функциональности к значительно более дорогой модели Claude Opus 4.8.

В Anthropic подчеркивают, что модели класса Sonnet стали одними из первых широко используемых инструментов для создания ИИ-агентов — систем, способных самостоятельно выполнять последовательности действий, использовать браузер, терминал, API и другие внешние инструменты. Тем не менее, в последние месяцы наибольшие успехи в этой области демонстрировали более крупные модели семейства Opus. Claude Sonnet 5, по утверждению компании, значительно сужает этот разрыв.

Разработчики сделали особый акцент на четырёх областях: логические рассуждения (reasoning), программирование, использование инструментов (tool use) и выполнение агентных задач. Согласно внутренним тестам Anthropic, Claude Sonnet 5 демонстрирует заметное улучшение по сравнению с Claude Sonnet 4.6 и на некоторых сценариях достигает уровня производительности Claude Opus 4.8 при значительно меньших затратах на вычисления.

Источник: Anthropic

Компания приводит результаты нескольких специализированных тестов, включая BrowseComp — бенчмарк для поиска и анализа информации, а также OSWorld-Verified — набор задач, имитирующих работу на реальном компьютере. По данным Anthropic, новая модель показывает более высокую эффективность в соотношении производительности и стоимости, особенно при среднем уровне вычислительных затрат.

По отзывам участников программы раннего доступа, Claude Sonnet 5 лучше справляется с продолжительными задачами, которые предыдущие поколения Sonnet часто оставляли незавершёнными. Разработчики также отмечают способность модели самостоятельно проверять свои результаты и исправлять ошибки без прямых указаний пользователя.

Отдельное внимание в Anthropic уделили вопросам безопасности. В соответствии с внутренними оценками Claude Sonnet 5 реже проявляет нежелательное поведение, чем Claude Sonnet 4.6, более эффективно отклоняет вредоносные запросы и более устойчив к атакам типа prompt injection — методам, при которых злоумышленник пытается изменить поведение модели с помощью специально сформулированных инструкций. Кроме того, новая версия демонстрирует более низкий уровень галлюцинаций и меньшее склонение соглашаться с ошибочными утверждениями пользователя.

Источник: Anthropic

Anthropic также подчеркивает, что модель не была специально обучена для задач кибербезопасности. В тестах, связанных с разработкой программных эксплойтов и выявлением уязвимостей, Claude Sonnet 5 показал значительно более слабые результаты по сравнению с Claude Opus 4.8. Тем не менее, компания предусмотрела для новой модели систему защиты от опасных киберсценариев по умолчанию.

Claude Sonnet 5 уже доступна пользователям всех тарифных планов Claude, включая Free и Pro, а также через Claude Code и API платформы Anthropic. До 31 августа 2026 года стоимость использования составит $2 за миллион входных токенов и $10 за миллион выходных токенов. После завершения промо-периода цена увеличится до $3 и $15 соответственно.

Darth SaharaИсточники:AnthropicИскусственный интеллект1Искусственный интеллектавтоматизацияAPIAnthropicLLMБольшие языковые моделиАгентыClaude Opus 4.8Claude Sonnet 5Reasoning17:54

Источник
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0

Поделись видео:
Подоляка