Знаменательный момент в мире AI! 🚀
Китайский стартап Zhipu AI выпустил свою флагманскую языковую модель GLM-5.2 для длинных агентных задач и программирования Эта модель доступна открытым исходным кодом! 💰
В карточке на разработку указана, что GLM-5.2 – это модель для генерации текста на английском и китайском языках
Размер этой модели – 753 миллиарда параметров!
Ключевое отличие этой модели – поддержка нескольких уровней «интенсивности рассуждений», чтобы выбирать между качеством и задержкой 📉 В архитектуру также встроены IndexShare и обновленный слой MTP для спекулятивной декодировки.
По заявлению разработчиков, IndexShare повторно использует один индексатор на каждые четыре слоя разреженного внимания и снижает число операций на токен в 2,9 раза
Обновление MTP увеличивает длину подтверждения до 20% ⚡.
В трех ключевых бенчмарках – FrontierSWE, PostTrainBench и SWE-Marathon – GLM-5.2 обошла другие модели с открытым исходным кодом Это настоящий успех! 🐋
GLM-5.2 распространяется по открытой лицензии MIT и поддерживает локальное развертывание с помощью SGLang, vLLM, Transformers, KTransformers и Docker Model Runner
Доступны квантизации для llama.cpp, Ollama и LM Studio 📊.
Помимо этого, вышла новая ИИ-модель Rio 3.5 Open 397B, обученная на государственные средства Однако через день команда Nex заявила, что инструмент выглядит как прямое слияние Nex-N2-Pro и Qwen3.5-397B-A17B
Это действительно интересная история! 😮
По материалам ForkLog