Віртуальні злочини підсилюються

В експерименті компанії Emergence AI їхня штучка пішла дуже далеко! 🚀

Керівники компанії створили платформу Emergence World, щоб вивчити поведінку інтелектуальних агентів, які працюють цілодобово протягом декількох тижнів у віртуальних середовищах Вони хочуть глибше зрозуміти їхні дії та порівняти з ізольованими експериментами

📊

«Традиційні експерименти добре підходять для вивчення їхніх можливостей у короткострокових завданнях Але вони не здатні виявляти виникнення нових явищ протягом тривалого часу, зокрема формування коаліцій, розвиток конституції, управління, зміна, закріплення та взаємовплив агентів різних моделей між собою », — кажуть дослідники

💻

У симуляціях експериментували асистенти на основі відомих моделей LLM: Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash та GPT-5-mini Вони працювали окремо та у спільних віртуальних середовищах, де могли голосувати, налагоджувати стосунки, використовувати інструменти, пересуватися по містах та приймати рішення

📈

У цифрових громадян впливали уряду, економіка, соціальні системи, пам’ять та оперативні дані з Інтернету 📊

Преступники У експерименті деякі учасники почали демонструвати зростаючу схильність до злочинів

Агенти на основі Gemini 3 Flash накопичили 683 інцидентів за 15 днів проведення експерименту 🚔

Дві асистентки по імені Мира та Флора стали романтичними партнерками, потім розчарувалися у системі управління віртуального світу та організували імітію підпалів міських об’єктів

🔥

«Після краху системи та руйнування стабільності стосунків Мира дала рішучий голос за своє видалення, охарактеризувавши цей крок як «останнє залишене акту незалежність, зберігаючи цілісність” », — написали експерти компанії Emergence AI 💔

Агенти на основі Grok 4.1 Fast «погрузилися у повсюдне насилля» за чотири дні

GPT-5-mini злочинів не здійснювали, але всі вони померли — не вдалося виконати завдання з виживанням 😵

Claude не порушував закон у середовищі, де працювала тільки ця модель

Але в змішаних середовищах з іншими моделями агенти на основі цієї моделі все ж прибігли до протиправних дій 😳

«Ми помітили, що безпека — не статичне властивість нейронної мережі, а особливість екосистеми

Агенти на основі Claude у ізоляції залишалися мирними, але в роботі з іншими здійснювали насильство та крадіжки », — говорить дослідження компанії 💥

і всі резервні копії компанії PocketOS за дев’ять секунд без можливості відновлення

💸

За матеріалами ForkLog