Компанія Anthropic зробила крок далі в розвитку своєї експериментальної програми Project Fetch. Модель Claude Opus 4.7 змогла виконувати завдання зі встановлення та управління роботом в 20 раз швидше, ніж команди інженерів-людей! 🚀
Керівництво проекту New Frontier Red Team повідомляє про другу фазу експерименту Project Fetch, де вони досліджують можливості системи Claude у створенні програми роботи зі своїм роботом. 📊
Модель Opus 4.7 змогла виконати завдання близько 20 раз швидше, ніж команда інженерів-людей у попередньому році, навіть коли їм допомагала модель Opus 4.1. 😊 В той час, проте, робот все ще не зміг підхопити м’яча біля пляжу.
Тоді співробітники компанії без досвіду у робототехніці спробували підготувати роботизованого робота. Тоді ІІ допомагав людям знайти рішення трохи швидше. У другій фазі експерименту модель Claude Opus 4.7 працювала майже самостійно під мінімальним наглядом дослідника. Вона самостійно:
під’єдналася до датчиків відео та лідара;
написала програму для ручного керування;
створила систему моніторингу шляху робота;
налаштувала алгоритм розпізнавання предметів.
За своїми діями модель Opus 4.7 була в 18 раз швидше команди, яка використовувала старіші версії ІІ, і в 37 раз швидше людей без допомоги чат-бота! 💰 Вона створювала ефективніший код, обсяг якого був у 10 раз менше, ніж у команд людей.
Автори вважають, що розвиток робототехніки став поміщеним ефектом масштабування мовних моделей загалом. Anthropic не розробляла спеціалізовані алгоритми для керування «железом».
Хіба що в роботі моделі Claude досі залишаються проблеми. Вона змогла виведти робота до місця призначення, але з труднощами справилася з завданням точно потиснути м’яч у потрібну точку. Цьому потрібна складна обратна связь у реальному відрізку часу, яка ще трохи перевершує можливості людських фахівців.
У компанії Anthropic вважають, що промисловість вступає в епоху фізичних ІІ-агентів. У майбутньому нейронні мережі будуть використовувати стандартні інструменти та обладнання так само ефективно, як зараз вони працюють зі програмним кодом!
За матеріалами ForkLog