Китайская Hunyuan представила гибридную MoE-модель Hy3 с 295 млрд параметров и контекстом 256K: ключевые особенности и тесты

Владимир Платонов · 23 апреля, 2026 15:40

Китайская команда Hunyuan выпустила в открытый доступ гибридную модель Hy3 с рекордными 295 млрд параметров, 21 млрд активных нейронов и поддержкой контекста 256K. Новинка работает в двух режимах мышления, сокращает время ответа на 47% и стабильно выполняет задачи на проде, включ.

ИИКитайская Hunyuan представила гибридную MoE-модель Hy3 с 295 млрд параметров и контекстом 256K: ключевые особенности и тесты
  • Hunyuan выпустила в открытый доступ гибридную MoE-модель Hy3 с 295 млрд параметров и 21 млрд активных нейронов.
  • Модель поддерживает контекст 256K и работает в режимах быстрого и медленного мышления, что позволяет ей обрабатывать длинные цепочки до 495 шагов.
  • Время до первого токена сокращено на 54%, полное время ответа — на 47% по сравнению с предыдущими версиями.
  • Hy3 стабильно выполняет задачи на проде: частота падений составляет менее 0,01% на запросах CodeBuddy и WorkBuddy.
  • Модель совместима с OpenClaw, OpenCode и KiloCode, а также поддерживает запуск через vLLM и SGLang.
  • На бенчах SWE-bench Verified, Terminal-Bench 2.0, BrowseComp и WideSearch Hy3 показывает результаты на уровне топовых кодинговых и поисковых агентов.

Китайская лаборатория Hunyuan представила вчера новую гибридную модель Hy3, которая стала первой после полной перестройки инфраструктуры предобучения и reinforcement learning. Новинка обладает 295 млрд параметров, из которых 21 млрд активны, и поддерживает контекст 256K — рекордное значение для моделей такого класса.

Hy3 работает в двух режимах: быстрого и медленного мышления. Это позволяет ей обрабатывать длинные цепочки до 495 шагов в продакшене, что критично для работы с документами, аналитикой данных и MCP-инструментами. Скорость инференса также была радикально улучшена: время до первого токена сокращено на 54%, а полное время ответа — на 47%. При этом частота падений модели на живых задачах CodeBuddy и WorkBuddy составляет менее 0,01% — один сбой на 10 тыс. запросов.

На стандартных бенчах Hy3 демонстрирует результаты на уровне топовых кодинговых и поисковых агентов.

Так, на SWE-bench Verified она показывает точность, сопоставимую с лучшими моделями для генерации кода, а на Terminal-Bench 2.0 — высокую стабильность работы в терминале. Модель также совместима с OpenClaw, OpenCode и KiloCode, а её запуск возможен через популярные фреймворки vLLM и SGLang. Эксперты отмечают, что Hy3 — это не просто новая модель, а целая платформа, построенная на переработанной инфраструктуре.

Она открывает новые возможности для разработчиков, которым требуется высокая точность, длинный контекст и стабильность работы в проде. Исходный код и веса модели доступны на GitHub и в ModelScope, что позволяет сообществу уже сегодня начать эксперименты с новой архитектурой.

Hunyuan Hy3 — это не просто очередной релиз, а настоящий прорыв в области больших языковых моделей. Сочетание рекордных параметров, длинного контекста и революционной архитектуры MoE делает её одной из самых перспективных моделей 2026 года. Особенно впечатляет стабильность работы на проде: частота падений в 0,01% — это уровень, до которого пока не дотягиваются даже топовые коммерческие решения. Если Hy3 оправдает ожидания на других задачах, она может стать стандартом для агентных систем следующего поколения.

Владимир Платонов

Владимир Платонов — автор и обозреватель финансовых рынков. Специализируется на Forex, брокерских сервисах и торговой инфраструктуре. В материалах анализирует условия торговли, исполнение ордеров и риски для частных трейдеров.