Anthropic попередила про небезпеку самоз удосконалення ІІ

Члени команди Anthropic все більше передають розробку нових моделей своїй ІІ-системі.

За останні кілька місяців Claude вже написав понад 80% коду сучасних продуктів компанії! 🚀 Це величезний крок вперед За другому кварталі цей показник зріс майже в 8 раз порівняно з 2024 роком.

Марина Фаваро, керівник інституту Anthropic, й Джек Кларк, співзасновник компанії, стверджують, що такий тренд може привести до створення системи, яка зможе створювати свій власний наступник цілком самостійно! 💰

Попри те, що цей процес ще не досяг своєї кінцевої точки, експерти підкреслюють, що рекурсивне самосовершенство може відбутися раніше, ніж очікується, і багато інститутів можуть не бути готовими до нього.

Бенчмарки та метрики

У квітні Claude вже виконав понад 800 коригувань – за оцінкою інженера, який керував цим проектом, людина потребувала б для цього майже 4 роки! 📊

На відкритих завданнях рівень успішних сесій Claude зріс до 76% у травні 2026 року – це майже на 50 відсотків більше ніж за 6 місяців!

У компанії повідомляють, що тривалість завдань, які ІІ може виконувати самостійно, збільшується майже вдвічі за кожні 4 місяці.

Під час внутрішніх випробувань модель Mythos Preview продемонструвала здатність виконувати дослідницькі завдання у галузі безпеки ІІ За 800 годин роботи групи агентів змогли закрити 97% проблемного розриву в експерименті, тоді як два дослідника людини змогли виконати лише 23% завдань за одну тижневу роботу! 💻

Нові проблеми

Хоча Claude вже показав свій потенціал у написанні коду, люди все ще мають перевагу у «дослідницькому суждінні» та определені стратегичні цілі.

У компанії вважають, що майбутнє розробників лежить не в написанні коду, а у глибокому аналізі результатів роботи нейросіті Це саме людина може стати головним обмеженням у швидкості розвитку нових моделей! 🚀

Також вони визнають, що світові потрібна можливість замедлити або тимчасово зупинити розвиток передових ІІ-систем, щоб суспільні інститути та дослідження у галузі рівноваги могли збігатися з прогресом

🌎

Паралельно вони попереджають, що одностороннє замедлення може стати проти тих, хто його запроваджує – менш обережні гравці можуть скоротити відставання Без глобального механізму координації рішення щодо безпеки будуть прийматися під впливом конкуренції й геополітичної ситуації! 💥

Перший звіт про Проект Glasswing – програму пошуку уразливостей за допомогою моделі Claude Mythos.

Того ж місяця компанія представила окремо моделі Claude Opus 4.8 та функцію динамічних робочих процесів для Claude Code

💻

За матеріалами ForkLog