Китайская Hunyuan представила гибридную MoE-модель Hy3 с 295 млрд параметров и контекстом 256K: ключевые особенности и тесты
Китайская команда Hunyuan выпустила в открытый доступ гибридную модель Hy3 с рекордными 295 млрд параметров, 21 млрд активных нейронов и поддержкой контекста 256K. Новинка работает в двух режимах мышления, сокращает время ответа на 47% и стабильно выполняет задачи на проде, включ.

- Hunyuan выпустила в открытый доступ гибридную MoE-модель Hy3 с 295 млрд параметров и 21 млрд активных нейронов.
- Модель поддерживает контекст 256K и работает в режимах быстрого и медленного мышления, что позволяет ей обрабатывать длинные цепочки до 495 шагов.
- Время до первого токена сокращено на 54%, полное время ответа — на 47% по сравнению с предыдущими версиями.
- Hy3 стабильно выполняет задачи на проде: частота падений составляет менее 0,01% на запросах CodeBuddy и WorkBuddy.
- Модель совместима с OpenClaw, OpenCode и KiloCode, а также поддерживает запуск через vLLM и SGLang.
- На бенчах SWE-bench Verified, Terminal-Bench 2.0, BrowseComp и WideSearch Hy3 показывает результаты на уровне топовых кодинговых и поисковых агентов.
Китайская лаборатория Hunyuan представила вчера новую гибридную модель Hy3, которая стала первой после полной перестройки инфраструктуры предобучения и reinforcement learning. Новинка обладает 295 млрд параметров, из которых 21 млрд активны, и поддерживает контекст 256K — рекордное значение для моделей такого класса.
Hy3 работает в двух режимах: быстрого и медленного мышления. Это позволяет ей обрабатывать длинные цепочки до 495 шагов в продакшене, что критично для работы с документами, аналитикой данных и MCP-инструментами. Скорость инференса также была радикально улучшена: время до первого токена сокращено на 54%, а полное время ответа — на 47%. При этом частота падений модели на живых задачах CodeBuddy и WorkBuddy составляет менее 0,01% — один сбой на 10 тыс. запросов.
На стандартных бенчах Hy3 демонстрирует результаты на уровне топовых кодинговых и поисковых агентов.
Так, на SWE-bench Verified она показывает точность, сопоставимую с лучшими моделями для генерации кода, а на Terminal-Bench 2.0 — высокую стабильность работы в терминале. Модель также совместима с OpenClaw, OpenCode и KiloCode, а её запуск возможен через популярные фреймворки vLLM и SGLang. Эксперты отмечают, что Hy3 — это не просто новая модель, а целая платформа, построенная на переработанной инфраструктуре.
Она открывает новые возможности для разработчиков, которым требуется высокая точность, длинный контекст и стабильность работы в проде. Исходный код и веса модели доступны на GitHub и в ModelScope, что позволяет сообществу уже сегодня начать эксперименты с новой архитектурой.
Hunyuan Hy3 — это не просто очередной релиз, а настоящий прорыв в области больших языковых моделей. Сочетание рекордных параметров, длинного контекста и революционной архитектуры MoE делает её одной из самых перспективных моделей 2026 года. Особенно впечатляет стабильность работы на проде: частота падений в 0,01% — это уровень, до которого пока не дотягиваются даже топовые коммерческие решения. Если Hy3 оправдает ожидания на других задачах, она может стать стандартом для агентных систем следующего поколения.
Владимир Платонов