Qwen3.6-35B-A3B: китайская модель с 35 млрд параметров, но всего 3 млрд активных — как это работает и почему это прорыв для ИИ
Китайская ИИ-модель Qwen3.6-35B-A3B от Alibaba бросает вызов традиционным подходам к масштабированию. Вместо увеличения активных параметров разработчики использовали архитектуру MoE, где из 35 млрд параметров задействованы всего около 3 млрд. Это позволяет снизить вычислительные.

- Модель Qwen3.6-35B-A3B от Alibaba использует архитектуру MoE, где из 35 млрд параметров активны только ~3 млрд, что снижает вычислительные затраты в 10 раз.
- По производительности в задачах agentic coding модель превосходит аналогичные dense-модели с 27 млрд параметров и конкурирует с более крупными решениями.
- Нативно поддерживает мультимодальность: текст и vision, сопоставима с Claude Sonnet 4.5 в VLM-бенчмарках, а в отдельных задачах превосходит его.
- В бенчмарках spatial reasoning демонстрирует лучшие результаты: MMMU — 81,7%, MMMU-Pro — 75,3%, MathVista — 86,4%, RealWorldQA — 85,3%.
- Лицензия Apache 2.0 позволяет использовать модель без ограничений для коммерческих и исследовательских задач.
- Высокая эффективность MoE делает модель идеальной для агентных сценариев, где важны последовательные действия и планирование.
Китайская ИИ-модель Qwen3.6-35B-A3B от Alibaba бросает вызов традиционным подходам к масштабированию моделей. Вместо увеличения активных параметров разработчики сделали ставку на архитектуру Mixture of Experts (MoE), где из 35 млрд параметров задействованы всего около 3 млрд.
Это позволяет снизить вычислительные затраты в 10 раз без потери качества, что делает модель доступной даже для средних компаний. В задачах agentic coding — когда модель должна выполнять последовательные действия и планировать решения — Qwen3.6-35B-A3B демонстрирует результаты, сравнимые с моделями, у которых активных параметров в 10 раз больше. Например, она превосходит Qwen3.5-27B (dense) и предыдущую версию Qwen3.5-35B-A3B. Это особенно важно для автоматизации рабочих процессов, где требуется высокая точность и минимальные затраты на инфраструктуру.
Модель также нативно поддерживает мультимодальность: она одинаково эффективно работает с текстом и изображениями.
В бенчмарках для vision-language моделей (VLM) Qwen3.6-35B-A3B сопоставима с Claude Sonnet 4.5, а в отдельных задачах spatial reasoning превосходит его. Например, в тестах MMMU она набрала 81,7% против 79,6% у конкурентов, а в MathVista — 86,4% против 79,8%. Эти показатели делают её одной из самых универсальных моделей на рынке.
Лицензия Apache 2.0 открывает широкие возможности для коммерческого использования без ограничений. Модель можно развернуть на собственных серверах или использовать через облачные сервисы, такие как Hugging Face или ModelScope.
Это особенно актуально для предприятий, которые хотят избежать зависимости от иностранных вендоров и сохранить контроль над данными. Эксперты отмечают, что Qwen3.6-35B-A3B — это шаг к новому поколению ИИ-моделей, где эффективность важнее размера. Архитектура MoE позволяет не только снизить затраты на вычисления, но и повысить скорость обработки запросов, что критично для реальных приложений. В условиях растущего спроса на ИИ-решения модель может стать одним из ключевых инструментов для автоматизации бизнеса и разработки новых продуктов.
Qwen3.6-35B-A3B — это не просто ещё одна большая языковая модель, а пример того, как инновации в архитектуре могут превзойти традиционные подходы к масштабированию. Китайские разработчики Alibaba доказали, что размер не всегда определяет качество. Использование MoE позволяет снизить порог входа для компаний, которые хотят интегрировать передовые ИИ-технологии в свои продукты. В условиях глобальной гонки за лидерство в ИИ такие решения становятся стратегически важными. Учитывая открытую лицензию и мультимодальные возможности, модель может стать основой для новых сервисов в области автоматизации, аналитики и генерации контента.
Владимир Платонов
