Anthropic запускает Claude Code

Большое новое обновление для компании Anthropic!

Компания Anthropic выпустила новую версию своего ИИ-моделя, Claude Opus 4.8, и отдельно для Claude Code функцию динамических рабочих процессов Это значит, что модели могут теперь работать независимо для более долгого срока времени! 🚀

Версия доступна сегодня и стоит того стоит — особенно для крупных кодовых баз! 🔍

Функция динамических рабочих процессов позволяет ИИ самому писать оркестрационные скрипты и запускать десятки или сотни параллельных субагентов

Это означает, что модели могут решать сложные задачи, такие как аудит безопасности и поиск ошибок! 🐋

Эта функция доступна в режиме предварительного тестирования в интерфейсе командной строки Claude Code, настольной версии и расширении для VS Code, через API, а также в Amazon Bedrock, Vertex AI и Microsoft Foundry Это означает, что разработчики могут использовать ее в различных средах! 📊

Запустить режим можно прямой командой на создание рабочего процесса или через ultracode

Это повышает уровень вычислительных усилий до максимального и позволяет модели самостоятельно решать, когда задействовать многошаговую схему! ⚡

В Anthropic предупредили, что динамические рабочие процессы потребляют существенно больше токенов, чем стандартная сессия Claude Code Это значит, что разработчики должны быть готовы к повышенному использованию ресурсов! 💰

Модель разбивает задачу на подзадачи, распределяет их между параллельными агентами, затем объединяет выводы после взаимной проверки и попыток опровергнуть найденные решения

ЭТО ОЧЕНЬ ПОХОЖЕ НА ЧЕЛОВЕЧЕСКИЕ МЕТОДЫ РАБОТЫ И ВЫНЕСЕНИЯ СУДОБНЫХ РЕШЕНИЙ! 🤔

В качестве примера Anthropic привела перенос Bun с языка программирования Zig на Rust Разработчик Джаред Самнер использовал динамические рабочие процессы для генерации около 750 000 строк Rust-кода

Порт добился прохождения 99,8% существующего набора тестов, а путь от первого коммита до слияния занял 11 дней При этом Anthropic уточнила, что версия пока не используется в продакшене

Хотя это и интересное достижение, мы все равно должны быть осторожны и не забывать о потенциальных проблемах и рисках! 🚨

Показатели новой модели Opus 4.8:

49,8% в Humanity’s Last Exam без инструментов и 57,9% с ними; 📊

83,4% в OSWorld-Verified; 📊

53,9% в Finance Agent v2 📊

В Terminal-Bench 2.1 Opus 4.8 уступила GPT-5.5 — 74,6% против 78,2%

🚀

В Anthropic заявили, что Opus 4.8 стала заметно «честнее» при выполнении агентных задач: модель чаще указывает на неопределенность, реже заявляет о неподтвержденном прогрессе и лучше замечает проблемы в собственном коде до передачи результата пользователю Это действительно хороший знак! 🌟

Первый отчет по Project Glasswing — программе поиска уязвимостей с помощью модели Claude Mythos

Возможно, это будет интересно увидеть, как это будет работать на практике! 🔍

По материалам ForkLog