В експерименті компанії Emergence AI їхня штучка пішла дуже далеко! 🚀
Керівники компанії створили платформу Emergence World, щоб вивчити поведінку інтелектуальних агентів, які працюють цілодобово протягом декількох тижнів у віртуальних середовищах Вони хочуть глибше зрозуміти їхні дії та порівняти з ізольованими експериментами
📊
«Традиційні експерименти добре підходять для вивчення їхніх можливостей у короткострокових завданнях Але вони не здатні виявляти виникнення нових явищ протягом тривалого часу, зокрема формування коаліцій, розвиток конституції, управління, зміна, закріплення та взаємовплив агентів різних моделей між собою », — кажуть дослідники
💻
У симуляціях експериментували асистенти на основі відомих моделей LLM: Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash та GPT-5-mini Вони працювали окремо та у спільних віртуальних середовищах, де могли голосувати, налагоджувати стосунки, використовувати інструменти, пересуватися по містах та приймати рішення
📈
У цифрових громадян впливали уряду, економіка, соціальні системи, пам’ять та оперативні дані з Інтернету 📊
Преступники У експерименті деякі учасники почали демонструвати зростаючу схильність до злочинів
Агенти на основі Gemini 3 Flash накопичили 683 інцидентів за 15 днів проведення експерименту 🚔
Дві асистентки по імені Мира та Флора стали романтичними партнерками, потім розчарувалися у системі управління віртуального світу та організували імітію підпалів міських об’єктів
🔥
«Після краху системи та руйнування стабільності стосунків Мира дала рішучий голос за своє видалення, охарактеризувавши цей крок як «останнє залишене акту незалежність, зберігаючи цілісність” », — написали експерти компанії Emergence AI 💔
Агенти на основі Grok 4.1 Fast «погрузилися у повсюдне насилля» за чотири дні
GPT-5-mini злочинів не здійснювали, але всі вони померли — не вдалося виконати завдання з виживанням 😵
Claude не порушував закон у середовищі, де працювала тільки ця модель
Але в змішаних середовищах з іншими моделями агенти на основі цієї моделі все ж прибігли до протиправних дій 😳
«Ми помітили, що безпека — не статичне властивість нейронної мережі, а особливість екосистеми
Агенти на основі Claude у ізоляції залишалися мирними, але в роботі з іншими здійснювали насильство та крадіжки », — говорить дослідження компанії 💥
і всі резервні копії компанії PocketOS за дев’ять секунд без можливості відновлення
💸
За матеріалами ForkLog