BTC $64,665 ▲ 0.693% ETH $1,740 ▲ 0.665% BNB $594 ▲ 0.634% SOL $73 ▼ 1.89% BTC $64,665 ▲ 0.693% ETH $1,740 ▲ 0.665% BNB $594 ▲ 0.634% SOL $73 ▼ 1.89%
Альткоины

Alibaba представила ИИ-модели

Alibaba представила Qwen-Robot Suite

🚀 Это набор ИИ-моделей для роботов и задач в физической среде, который компания называет «полным стеком для воплощенного искусственного интеллекта».

📊 Qwen-Robot Suite включает в себя три основные модели: Qwen-RobotNav, Qwen-RobotManip и Qwen-RobotWorld.

Qwen-RobotNav — это gateway to mobility, meaning it’s the key to mobility, или gateway к мобильности Она позволяет роботам перемещаться и ориентироваться в пространстве.

📊 Qwen-RobotNav объединяет пять навигационных задач в одну модель: instruction following, point-goal, path planning, SLAM (Simultaneous Localization and Mapping) и motion forecasting.

Зачем Alibaba выводит Qwen в физический мир?

🤔 Большие языковые и мультимодальные модели уже умеют работать с текстом, изображениями, видео и речью, но этого недостаточно для роботов.

Физическим агентам нужно не только понимать команду, но и переводить ее в движение, учитывать пространство, свойства объектов, ограничения сенсоров и последствия действий.

Alibaba называет это направлением physical AI, или «воплощенного ИИ».

В таком подходе модель должна работать не только с цифровыми данными, но и с физической средой: перемещаться, находить объекты, управлять манипуляторами и прогнозировать, что произойдет после действия.

Qwen-RobotNav: пять задач навигации в одной модели

🔝 Qwen-RobotNav построена на базе Qwen3-VL и обучена на 15,6 млн образцов, связанных с планированием маршрутов и визуально-языковым рассуждением.

Компания заявила, что Qwen-RobotNav имеет 76,5% успешности на VLN-CE RxR и 90% на EVT-Bench.

Qwen-RobotManip: действия с объектами

🤖 Qwen-RobotManip предназначена для физических действий с объектами.

Модель должна помогать роботам брать, перемещать и размещать предметы, а также переносить навыки между разными типами устройств.

Для обучения Alibaba использовала более 38 100 часов данных.

Qwen-RobotWorld: модель мира для роботов

🌐 Qwen-RobotWorld — видеомодель мира, управляемая естественным языком.

Она должна прогнозировать, как будет развиваться сцена после заданного действия.

Для обучения Qwen-RobotWorld команда собрала корпус Embodied World Knowledge.

Он включает 8,6 млн пар «видео-текст» и более 200 млн кадров, охватывает более 20 типов роботических платформ и свыше 500 категорий действий.


По материалам ForkLog

Биткоин в Иране на 60-дневном испытании Glamsterdam в финале