Борьба за звание лучшей ИИ-модели: что произошло с Rio 3.5 Open 397B?
В прошлом году муниципальная IT-компания Рио-де-Жанейро IplanRIO представила открытую ИИ-модель под названием Rio 3.5 Open 397B Эта модель была обучена на государственные средства и claimed, что она превосходит DeepSeek V4 Pro и Qwen 3.7 Plus по ряду бенчмарков
Однако, через день после релиза, команда ИИ-разработчик Nex заявила, что Rio 3.5 Open 397B является прямым слиянием Nex-N2-Pro и Qwen3.5-397B-A17B.
🚀 Нейронные сети и их секреты И plan RIO обновила карточку Rio 3.5 Open 397B на Hugging Face, в новом описании указано, что модель построена через слияние Nex-N2-Pro и Qwen3.5-397B-A17B с последующей дистилляцией от более сильной модели.
Как представляли Rio 3.5, IplanRIO выложила на Hugging Face 13 июня 2026 года под лицензией MIT В первоначальном описании проект называли ИИ-системой общего назначения «передового уровня» и указывали, что модель дообучена на базе Qwen3.5-397B-A17B.
📊 Как это работает? В характеристиках говорилось о 397 млрд параметров, из которых 17 млрд активируются при обработке каждого токена
Такая архитектура называется Mixture-of-Experts (MoE): модель использует не все параметры сразу, а только часть специализированных блоков.
IplanRIO также заявляла контекстное окно на 1,01 млн токенов и использование SwiReasoning В описании проекта этот фреймворк представлен как механизм, который переключает модель между явным и скрытым режимами рассуждений.
🤔 Но что же произошло? В первой версии карточки проекта приводились результаты тестов, по которым Rio 3.5 обходила Qwen 3.7 Plus и DeepSeek V4 Pro
На Terminal-Bench 2.1 модель набрала 70,8% против 70,3% у Qwen 3.7 Plus и 67,9% у DeepSeek V4 Pro.
После релиза мэр Рио-де-Жанейро Эдуардо Кавальери написал в X, что открытая ИИ-модель, обученная в Рио на государственные средства, «превзошла все остальные модели».
Nex открыла в репозитории Nex-N2 на GitHub и заявила, что Rio 3.5 Open 397B представлена как оригинальная модель IplanRIO, но ее веса выглядят как прямое поэлементное слияние Nex-N2-Pro и Qwen3.5-397B-A17B.
📊 Как это работает? По оценке Nex, Rio 3.5 примерно на 60% состоит из Nex-N2-Pro и на 40% из Qwen3.5-397B-A17B Компания утверждает, что не нашла признаков самостоятельного обучения IplanRIO.
Nex привела два аргумента
После удаления системного промпта «You are Rio» модель, по утверждению компании, называла себя «Nex, from Nex-AGI» в 79% ответов и ни разу не называла себя Rio Также Nex заявила, что каждый тензор весов Rio повторяет пропорцию 0,6/0,4 между Nex и Qwen во всех 60 слоях модели.
«Невинного объяснения этому нет», — говорится в заявлении Nex.
🤯 В чем суть спора Использование открытых моделей само по себе не является нарушением
Nex-N2-Pro опубликована под лицензией Apache 2.0, а Qwen3.5-397B-A17B также доступна как открытая модель Такие лицензии позволяют использовать, изменять и распространять модели при соблюдении условий.
Спор возник из-за презентации Rio 3.5
Первоначальная карточка создавала впечатление самостоятельной разработки и дообучения на базе Qwen3.5-397B-A17B, но не указывала Nex-N2-Pro как один из источников В open-source-сообществе это воспринимают как проблему прозрачности.
Ранее Alibaba семейство «гибридных» ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.
DeepSeek-R1 в январе 2025 года
Эта модель стала стала одним из главных событий ИИ-рынка на тот момент.
По материалам ForkLog