Google DeepMind закрыл 9 задач Эрдёша с помощью AlphaProof Nexus: как формальные доказательства меняют математику

Владимир Платонов · 25 мая, 2026 10:14
ИИGoogle DeepMind закрыл 9 задач Эрдёша с помощью AlphaProof Nexus: как формальные доказательства меняют математику

AlphaProof Nexus от DeepMind доказал 9 задач Эрдёша, включая десятилетиями нерешенные, с использованием формальных методов и Lean для проверки логических шагов. Система исключает ошибки и находит неточности в существующих доказательствах.

  • AlphaProof Nexus от Google DeepMind автономно доказал 9 задач Эрдёша, включая задачи, висевшие десятилетиями, с минимальными затратами
  • Система использует Lean для формальной проверки каждого логического шага, исключая ошибки, которые могли бы остаться незамеченными в ручных доказательствах
  • Базовый агент, сочетающий генерацию LLM и обратную связь от компилятора, повторил все успешные решения, а более сложные версии показали выигрыш только на самых сложных задачах
  • AlphaProof Nexus не только решает задачи, но и находит ошибки в существующих формализациях, работая как диагностический инструмент
  • Система эффективна в областях, где Lean уже развит (комбинаторика, теория чисел, оптимизация), но пока не справляется с задачами, требующими построения новой теории
  • Подход применим к верификации кода, спецификаций и криптографии, где формальная проверка исключает галлюцинации моделей

Google DeepMind представил систему AlphaProof Nexus, которая автономно доказала 9 открытых задач Эрдёша, включая некоторые, которые не удавалось решить десятилетиями. Стоимость решения одной задачи составила всего несколько сотен долларов, что делает этот подход крайне эффективным по сравнению с традиционными методами.

Система работает по принципу генерации идей и фрагментов доказательств с последующей формальной проверкой через Lean — инструмент, который компилирует и проверяет логические шаги доказательства. Если доказательство содержит ошибку, оно не проходит проверку, исключая необходимость ручного рецензирования. Базовый агент, сочетающий генерацию LLM и обратную связь от компилятора, успешно повторил все 9 решений задач Эрдёша, а более сложные версии с эволюционным поиском и reinforcement learning показали преимущество только на самых сложных задачах. Отличие от неформальных доказательств заключается в том, что AlphaProof Nexus сразу отсекает ошибки, такие как несуществующие леммы или ссылки на несуществующие результаты, которые в обычных текстах могли бы остаться незамеченными.

Кроме того, система обнаружила неточности в уже существующих формализациях математических утверждений, работая не только как решатель, но и как диагностический инструмент.

Успехи AlphaProof Nexus сосредоточены в областях, где библиотека Lean уже достаточно развита, таких как комбинаторика, теория чисел и оптимизация. Однако задачи, требующие построения нового пласта теории, пока остаются вне зоны досягаемости системы. Большинство задач Эрдёша остаются нерешенными.

Подход, использованный в AlphaProof Nexus, применим не только к математике, но и к другим областям, где важна формальная проверка, например, кодинг, спецификации, верификация протоколов, компиляторов и криптографии. Формальная проверка исключает галлюцинации моделей, что делает этот метод особенно ценным в критически важных областях.

Появление AlphaProof Nexus демонстрирует, как формальные методы могут ускорить и упростить процесс доказательства математических задач. Однако ключевым ограничением остается зависимость от зрелости инструментов формальной проверки, таких как Lean. В ближайшее время стоит следить за тем, как этот подход будет адаптироваться к другим областям, где требуется высокая степень точности и проверки, например, в разработке программного обеспечения или криптографии. Риски связаны с тем, что система пока не справляется с задачами, требующими создания новой теории, и эффективность может варьироваться в зависимости от области применения.

Владимир Платонов

Владимир Платонов — автор и обозреватель финансовых рынков. Специализируется на Forex, брокерских сервисах и торговой инфраструктуре. В материалах анализирует условия торговли, исполнение ордеров и риски для частных трейдеров.