BTC $64,494 ▲ 0.813% ETH $1,736 ▲ 0.525% BNB $592 ▲ 0.356% SOL $73 ▼ 1.489% BTC $64,494 ▲ 0.813% ETH $1,736 ▲ 0.525% BNB $592 ▲ 0.356% SOL $73 ▼ 1.489%
Альткоины

IplanRIO: Rio 3.5

Борьба за звание лучшей ИИ-модели: что произошло с Rio 3.5 Open 397B?

В прошлом году муниципальная IT-компания Рио-де-Жанейро IplanRIO представила открытую ИИ-модель под названием Rio 3.5 Open 397B Эта модель была обучена на государственные средства и claimed, что она превосходит DeepSeek V4 Pro и Qwen 3.7 Plus по ряду бенчмарков

Однако, через день после релиза, команда ИИ-разработчик Nex заявила, что Rio 3.5 Open 397B является прямым слиянием Nex-N2-Pro и Qwen3.5-397B-A17B.

🚀 Нейронные сети и их секреты И plan RIO обновила карточку Rio 3.5 Open 397B на Hugging Face, в новом описании указано, что модель построена через слияние Nex-N2-Pro и Qwen3.5-397B-A17B с последующей дистилляцией от более сильной модели.

Как представляли Rio 3.5, IplanRIO выложила на Hugging Face 13 июня 2026 года под лицензией MIT В первоначальном описании проект называли ИИ-системой общего назначения «передового уровня» и указывали, что модель дообучена на базе Qwen3.5-397B-A17B.

📊 Как это работает? В характеристиках говорилось о 397 млрд параметров, из которых 17 млрд активируются при обработке каждого токена

Такая архитектура называется Mixture-of-Experts (MoE): модель использует не все параметры сразу, а только часть специализированных блоков.

IplanRIO также заявляла контекстное окно на 1,01 млн токенов и использование SwiReasoning В описании проекта этот фреймворк представлен как механизм, который переключает модель между явным и скрытым режимами рассуждений.

🤔 Но что же произошло? В первой версии карточки проекта приводились результаты тестов, по которым Rio 3.5 обходила Qwen 3.7 Plus и DeepSeek V4 Pro

На Terminal-Bench 2.1 модель набрала 70,8% против 70,3% у Qwen 3.7 Plus и 67,9% у DeepSeek V4 Pro.

После релиза мэр Рио-де-Жанейро Эдуардо Кавальери написал в X, что открытая ИИ-модель, обученная в Рио на государственные средства, «превзошла все остальные модели».

Nex открыла в репозитории Nex-N2 на GitHub и заявила, что Rio 3.5 Open 397B представлена как оригинальная модель IplanRIO, но ее веса выглядят как прямое поэлементное слияние Nex-N2-Pro и Qwen3.5-397B-A17B.

📊 Как это работает? По оценке Nex, Rio 3.5 примерно на 60% состоит из Nex-N2-Pro и на 40% из Qwen3.5-397B-A17B Компания утверждает, что не нашла признаков самостоятельного обучения IplanRIO.

Nex привела два аргумента

После удаления системного промпта «You are Rio» модель, по утверждению компании, называла себя «Nex, from Nex-AGI» в 79% ответов и ни разу не называла себя Rio Также Nex заявила, что каждый тензор весов Rio повторяет пропорцию 0,6/0,4 между Nex и Qwen во всех 60 слоях модели.

«Невинного объяснения этому нет», — говорится в заявлении Nex.

🤯 В чем суть спора Использование открытых моделей само по себе не является нарушением

Nex-N2-Pro опубликована под лицензией Apache 2.0, а Qwen3.5-397B-A17B также доступна как открытая модель Такие лицензии позволяют использовать, изменять и распространять модели при соблюдении условий.

Спор возник из-за презентации Rio 3.5

Первоначальная карточка создавала впечатление самостоятельной разработки и дообучения на базе Qwen3.5-397B-A17B, но не указывала Nex-N2-Pro как один из источников В open-source-сообществе это воспринимают как проблему прозрачности.

Ранее Alibaba семейство «гибридных» ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.

DeepSeek-R1 в январе 2025 года

Эта модель стала стала одним из главных событий ИИ-рынка на тот момент.


По материалам ForkLog

Биткоин уже приносит доход Модель биткоин-экономики