Журнал
Владимир Платонов · 31 марта, 2026 17:42

CMU представила революционную систему CAID: как асинхронные агенты с git-интеграцией на 26,7% точнее решают задачи разработки

CMU представила революционную систему CAID: как асинхронные агенты с git-интеграцией на 26,7% точнее решают задачи разработки
  • Система CAID от CMU использует асинхронные агенты с явной координацией через граф зависимостей и git-деревья.
  • Точность воспроизведения задач по научным статьям (PaperBench) выросла на 26,7% по сравнению с одиночными агентами.
  • Для задач разработки Python-библиотек (Commit0) прирост составил 14,3% по сравнению с многоконтурными подходами.
  • Изоляция задач и явная интеграция через git merge превосходят как масштабирование одиночных агентов, так и наивные многоконтурные системы.
  • CAID заимствует лучшие практики человеческой разработки: менеджер строит граф зависимостей, а агенты работают в изолированных средах с обязательным тестированием.

Учёные из университета Карнеги-Меллон (CMU) представили революционную систему координации асинхронных агентов — CAID (Centralized Asynchronous Isolated Delegation). Новый подход, описанный в статье от 31 марта 2026 года, доказывает, что явная координация через граф зависимостей и изолированные задачи в git-деревьях превосходит как одиночные агенты, так и традиционные многоконтурные системы.

По данным исследования, CAID демонстрирует рост точности на 26,7% при воспроизведении задач из научных статей (PaperBench) и на 14,3% — для задач разработки Python-библиотек (Commit0). Ключевое отличие системы заключается в имитации процессов человеческой разработки: менеджер строит граф задач, а агенты работают в изолированных средах, выполняют задачи параллельно, тестируют код и интегрируют изменения через git merge. Эксперименты показали, что изоляция задач и явная интеграция через примитивы git превосходят как масштабирование одиночных агентов, так и наивные подходы с многоконтурными системами. Это означает, что для долгосрочных задач в разработке ПО координация через CAID должна стать стандартом, а не исключением.

По мнению авторов работы, новый метод открывает перспективы для автоматизации сложных инженерных процессов, где координация и контроль качества критически важны.

Исследование доступно на платформе arXiv по ссылке: https://arxiv.org/abs/2603.21489. Система CAID может стать основой для создания более надёжных и масштабируемых решений в области ИИ-агентов, особенно в задачах, требующих высокой точности и параллелизма.

Новая работа CMU — это не просто технический прорыв, а фундаментальная смена парадигмы в разработке ПО с помощью ИИ. Традиционно считалось, что масштабирование числа итераций или агентов автоматически повышает качество, но CAID доказала, что ключ — в правильной координации. Этот подход может перевернуть индустрию, особенно в условиях растущего спроса на автоматизацию сложных инженерных задач. Уже сейчас очевидно, что системы вроде CAID станут стандартом для компаний, стремящихся к максимальной эффективности и предсказуемости в разработке.

Владимир Платонов

Владимир Платонов

Автор и обозреватель

Владимир Платонов — автор и обозреватель финансовых рынков. Специализируется на Forex, брокерских сервисах и торговой инфраструктуре. В материалах анализирует условия торговли, исполнение ордеров и риски для частных трейдеров.

  • Темы: Forex, брокеры, торговые платформы, риск-менеджмент.
  • Подход: проверка фактов, сценарный анализ, прикладные рекомендации.
  • Форматы: обзоры, разборы компаний, комментарии по рынку.