Члени команди Anthropic все більше передають розробку нових моделей своїй ІІ-системі.
За останні кілька місяців Claude вже написав понад 80% коду сучасних продуктів компанії! 🚀 Це величезний крок вперед За другому кварталі цей показник зріс майже в 8 раз порівняно з 2024 роком.
Марина Фаваро, керівник інституту Anthropic, й Джек Кларк, співзасновник компанії, стверджують, що такий тренд може привести до створення системи, яка зможе створювати свій власний наступник цілком самостійно! 💰
Попри те, що цей процес ще не досяг своєї кінцевої точки, експерти підкреслюють, що рекурсивне самосовершенство може відбутися раніше, ніж очікується, і багато інститутів можуть не бути готовими до нього.
Бенчмарки та метрики
У квітні Claude вже виконав понад 800 коригувань – за оцінкою інженера, який керував цим проектом, людина потребувала б для цього майже 4 роки! 📊
На відкритих завданнях рівень успішних сесій Claude зріс до 76% у травні 2026 року – це майже на 50 відсотків більше ніж за 6 місяців!
У компанії повідомляють, що тривалість завдань, які ІІ може виконувати самостійно, збільшується майже вдвічі за кожні 4 місяці.
Під час внутрішніх випробувань модель Mythos Preview продемонструвала здатність виконувати дослідницькі завдання у галузі безпеки ІІ За 800 годин роботи групи агентів змогли закрити 97% проблемного розриву в експерименті, тоді як два дослідника людини змогли виконати лише 23% завдань за одну тижневу роботу! 💻
Нові проблеми
Хоча Claude вже показав свій потенціал у написанні коду, люди все ще мають перевагу у «дослідницькому суждінні» та определені стратегичні цілі.
У компанії вважають, що майбутнє розробників лежить не в написанні коду, а у глибокому аналізі результатів роботи нейросіті Це саме людина може стати головним обмеженням у швидкості розвитку нових моделей! 🚀
Також вони визнають, що світові потрібна можливість замедлити або тимчасово зупинити розвиток передових ІІ-систем, щоб суспільні інститути та дослідження у галузі рівноваги могли збігатися з прогресом
🌎
Паралельно вони попереджають, що одностороннє замедлення може стати проти тих, хто його запроваджує – менш обережні гравці можуть скоротити відставання Без глобального механізму координації рішення щодо безпеки будуть прийматися під впливом конкуренції й геополітичної ситуації! 💥
Перший звіт про Проект Glasswing – програму пошуку уразливостей за допомогою моделі Claude Mythos.
Того ж місяця компанія представила окремо моделі Claude Opus 4.8 та функцію динамічних робочих процесів для Claude Code
💻
За матеріалами ForkLog