Baidu выпустила Ernie 5.1: модель с третью параметров Ernie 5.0 и рекордной эффективностью

Владимир Платонов · 12 мая, 2026 21:56
ИИBaidu выпустила Ernie 5.1: модель с третью параметров Ernie 5.0 и рекордной эффективностью

Baidu представила Ernie 5.1 — языковую модель с закрытыми весами, которая использует всего 6% типичного бюджета для претрейна и содержит треть параметров Ernie 5.0. Модель заняла 4 место в мировом рейтинге Arena Search Leaderboard и обходит DeepSeek-V4-Pro в задачах с агентами.

  • Baidu выпустила Ernie 5.1 с закрытыми весами, занявшую 4 место в мировом рейтинге Arena Search Leaderboard и 1 место среди китайских моделей
  • Затраты на претрейн Ernie 5.1 составили всего 6% от типичного бюджета для моделей аналогичного класса, а при инференсе используется вдвое меньше активных параметров
  • Новинка построена на базе Ernie 5.0, но содержит лишь треть от общего числа параметров благодаря методике Once-For-All, позволившей обучать семейство моделей за один проход
  • В тестах Ernie 5.1 обходит DeepSeek-V4-Pro в задачах с агентами и демонстрирует сопоставимые с Gemini 3.1 Pro результаты в логике и математике
  • Для борьбы с эффектом качелей (падением креативности при улучшении логики) Baidu использовала четырехэтапный файнтюн: SFT, параллельную тренировку экспертов, дистилляцию и RL
  • Доступ к Ernie 5.1 открыт через онлайн-платформы Baidu, что позволяет уже сейчас оценить её возможности в реальных сценариях

Китайский технологический гигант Baidu представил новую языковую модель Ernie 5.1 с закрытыми весами, которая уже обошла конкурентов по соотношению цены и качества. Модель заняла 4 место в мировом рейтинге Arena Search Leaderboard и первое среди китайских разработок, продемонстрировав, что высокая эффективность не всегда требует массивных затрат.

По данным компании, затраты на претрейн Ernie 5.1 составили всего 6% от типичного бюджета для моделей аналогичного класса, что делает её одной из самых экономичных в своём сегменте. Ernie 5.1 построена на базе предыдущей версии Ernie 5.0, но содержит лишь треть от общего числа параметров. При этом при инференсе используется вдвое меньше активных параметров, что значительно снижает вычислительные затраты. Такой подход стал возможен благодаря методике Once-For-All, которая позволила Baidu обучать целое семейство моделей за один проход.

Основной претрейн был выполнен ещё при создании Ernie 5.0, а для версии 5.1 потребовалось лишь извлечь оптимальную конфигурацию из уже существующих весов.

В тестах Ernie 5.1 продемонстрировала впечатляющие результаты: в задачах с агентами она обходит DeepSeek-V4-Pro, а в логических и математических тестах сопоставима с Gemini 3.1 Pro. Это подтверждает, что модель способна конкурировать с ведущими мировыми разработками, несмотря на меньшее количество параметров. Экономия вычислений достигнута не только за счёт архитектуры, но и благодаря четырёхэтапному файнтюну, который включал стандартную SFT, параллельную тренировку узкоспециализированных экспертов, дистилляцию их навыков в единую модель и финальный reinforcement learning.

Однако Baidu пришлось решать проблему, известную как «эффект качелей»: улучшение логических способностей модели часто сопровождается падением креативности. Для борьбы с этим инженеры компании применили четырёхэтапный подход, который позволил сбалансировать оба аспекта.

В результате Ernie 5.1 демонстрирует стабильно высокие результаты как в аналитических задачах, так и в генерации текстов. Доступ к модели открыт через онлайн-платформы Baidu, что позволяет уже сейчас оценить её возможности в реальных сценариях. Выход Ernie 5.1 может стать важным сигналом для рынка: Baidu доказала, что высокая производительность не всегда требует экстремальных затрат на вычисления. Это особенно актуально на фоне растущих расходов на обучение больших языковых моделей, которые становятся недоступными для многих компаний.

Теперь ключевой вопрос — насколько быстро Ernie 5.1 сможет завоевать популярность среди разработчиков и бизнеса, и какие новые задачи она откроет для китайского ИИ-сектора.

Выход Ernie 5.1 — это не просто новый релиз, а демонстрация того, как можно оптимизировать разработку больших языковых моделей без потери качества. Baidu удалось совместить экономичность и высокую производительность, что может перевернуть представление о том, какие модели считать «большими». Однако остаётся открытым вопрос о доступности модели за пределами Китая и её интеграции в глобальные экосистемы. Также стоит следить за тем, как Ernie 5.1 будет справляться с задачами, требующими глубокого контекста или нестандартных решений — здесь её меньшая архитектура может стать ограничением.

Владимир Платонов

Владимир Платонов — автор и обозреватель финансовых рынков. Специализируется на Forex, брокерских сервисах и торговой инфраструктуре. В материалах анализирует условия торговли, исполнение ордеров и риски для частных трейдеров.