Компанія Anthropic розробила платформу для керування агентами. Нова функція «Клод» має особливість «сновидінь», оцінки результатів та проведення декількох ботів.
Функція «Сновидінь» дозволяє агентам аналізувати минулі сесії та знаходити закономірності у роботі. Система виявляє повторювальні помилки та успішні сценарії — і на основі цього оновлює алгоритми без участі людини. Понад то, користувачі можуть встановити автоматичне оновлення пам’яті ІІ або підтверджувати зміни вручну. 🤖💡
Розробники також впровадили інструменти «Результати» та «Вебхуки». Тепер автори додатків можуть встановлювати критерії якості роботи агента. Відокремлений «оціник» перевіряє результат на відповідність вимогам — незалежно від основного процесу виконання завдань. Якщо результат не відповідає стандарту, агент переходить до виправлення помилок. 📊🔍
За інформацією Anthropic, інструменти «Результати» підвищили ефективність виконання складних завдань на 10 %. Качество генерації документів у форматі .docx та .pptx зросло в середньому на 9 %. 📈💻
Третє оновлення — оркестрування декількох агентів. «Головний» ІІ може надавати підзавдання спеціалістам однієї спеціалізації: один аналізує історію розгортання коду, інший — логи помилок, третій — тикети служби підтримки. Все вони працюють паралельно над загальним набором файлів. 🤝📊
Гарві та Netflix випробовують новинки. Партнери компанії вже випробовують нові функції. Платформа Гарві використовує «Сновидіння» для підготовки юридичних документів — швидкість виконання завдань збільшила в шість разів. Команда Netflix використала мультиагентну систему для аналізу логів збірки програм. 🚀💻
Функція «Сновидіння» доступна в режимі попереднього перегляду за запитом. Інструменти «Результатів» та мультиагентна оркестрування прийшли до етапу публічного бета-тестування. 🎉👍
З’явлення «саморозвиваючогося ІІ» до 2028 року. 🤔💻
https://forklog.com/news/ai/ceo-anthropic-predskazal-skoroe-poyavlenie-agi-i-sokrashheniya-rabochih-mest/
За матеріалами ForkLog