Anthropic навчила Claude «мріяти»

Компанія Anthropic розробила платформу для керування агентами. Нова функція «Клод» має особливість «сновидінь», оцінки результатів та проведення декількох ботів.

Функція «Сновидінь» дозволяє агентам аналізувати минулі сесії та знаходити закономірності у роботі. Система виявляє повторювальні помилки та успішні сценарії — і на основі цього оновлює алгоритми без участі людини. Понад то, користувачі можуть встановити автоматичне оновлення пам’яті ІІ або підтверджувати зміни вручну. 🤖💡

Розробники також впровадили інструменти «Результати» та «Вебхуки». Тепер автори додатків можуть встановлювати критерії якості роботи агента. Відокремлений «оціник» перевіряє результат на відповідність вимогам — незалежно від основного процесу виконання завдань. Якщо результат не відповідає стандарту, агент переходить до виправлення помилок. 📊🔍

За інформацією Anthropic, інструменти «Результати» підвищили ефективність виконання складних завдань на 10 %. Качество генерації документів у форматі .docx та .pptx зросло в середньому на 9 %. 📈💻

Третє оновлення — оркестрування декількох агентів. «Головний» ІІ може надавати підзавдання спеціалістам однієї спеціалізації: один аналізує історію розгортання коду, інший — логи помилок, третій — тикети служби підтримки. Все вони працюють паралельно над загальним набором файлів. 🤝📊

Гарві та Netflix випробовують новинки. Партнери компанії вже випробовують нові функції. Платформа Гарві використовує «Сновидіння» для підготовки юридичних документів — швидкість виконання завдань збільшила в шість разів. Команда Netflix використала мультиагентну систему для аналізу логів збірки програм. 🚀💻

Функція «Сновидіння» доступна в режимі попереднього перегляду за запитом. Інструменти «Результатів» та мультиагентна оркестрування прийшли до етапу публічного бета-тестування. 🎉👍

З’явлення «саморозвиваючогося ІІ» до 2028 року. 🤔💻

https://forklog.com/news/ai/ceo-anthropic-predskazal-skoroe-poyavlenie-agi-i-sokrashheniya-rabochih-mest/

За матеріалами ForkLog