Большое новое обновление для компании Anthropic!
Компания Anthropic выпустила новую версию своего ИИ-моделя, Claude Opus 4.8, и отдельно для Claude Code функцию динамических рабочих процессов Это значит, что модели могут теперь работать независимо для более долгого срока времени! 🚀
Версия доступна сегодня и стоит того стоит — особенно для крупных кодовых баз! 🔍
Функция динамических рабочих процессов позволяет ИИ самому писать оркестрационные скрипты и запускать десятки или сотни параллельных субагентов
Это означает, что модели могут решать сложные задачи, такие как аудит безопасности и поиск ошибок! 🐋
Эта функция доступна в режиме предварительного тестирования в интерфейсе командной строки Claude Code, настольной версии и расширении для VS Code, через API, а также в Amazon Bedrock, Vertex AI и Microsoft Foundry Это означает, что разработчики могут использовать ее в различных средах! 📊
Запустить режим можно прямой командой на создание рабочего процесса или через ultracode
Это повышает уровень вычислительных усилий до максимального и позволяет модели самостоятельно решать, когда задействовать многошаговую схему! ⚡
В Anthropic предупредили, что динамические рабочие процессы потребляют существенно больше токенов, чем стандартная сессия Claude Code Это значит, что разработчики должны быть готовы к повышенному использованию ресурсов! 💰
Модель разбивает задачу на подзадачи, распределяет их между параллельными агентами, затем объединяет выводы после взаимной проверки и попыток опровергнуть найденные решения
ЭТО ОЧЕНЬ ПОХОЖЕ НА ЧЕЛОВЕЧЕСКИЕ МЕТОДЫ РАБОТЫ И ВЫНЕСЕНИЯ СУДОБНЫХ РЕШЕНИЙ! 🤔
В качестве примера Anthropic привела перенос Bun с языка программирования Zig на Rust Разработчик Джаред Самнер использовал динамические рабочие процессы для генерации около 750 000 строк Rust-кода
Порт добился прохождения 99,8% существующего набора тестов, а путь от первого коммита до слияния занял 11 дней При этом Anthropic уточнила, что версия пока не используется в продакшене
Хотя это и интересное достижение, мы все равно должны быть осторожны и не забывать о потенциальных проблемах и рисках! 🚨
Показатели новой модели Opus 4.8:
49,8% в Humanity’s Last Exam без инструментов и 57,9% с ними; 📊
83,4% в OSWorld-Verified; 📊
53,9% в Finance Agent v2 📊
В Terminal-Bench 2.1 Opus 4.8 уступила GPT-5.5 — 74,6% против 78,2%
🚀
В Anthropic заявили, что Opus 4.8 стала заметно «честнее» при выполнении агентных задач: модель чаще указывает на неопределенность, реже заявляет о неподтвержденном прогрессе и лучше замечает проблемы в собственном коде до передачи результата пользователю Это действительно хороший знак! 🌟
Первый отчет по Project Glasswing — программе поиска уязвимостей с помощью модели Claude Mythos
Возможно, это будет интересно увидеть, как это будет работать на практике! 🔍
По материалам ForkLog