BFS-Prover-V2: масштабирование многооборотного RL и многоагентного поиска по дереву для LLM Step-Provers Мы представляем BFS-Prover-V2, современную систему доказательства теорем на уровне шагов с открытым исходным кодом для Lean4, предназначенную для решения двойной задачи масштабирования как обучения, так и вывода при доказательстве теорем на основе нейронов. BFS-Prover-V2 представляет новые решения для преодоления этих ограничений за счет: 1. Масштабирования времени обучения: новая многоэтапная система экспертных итераций с адаптивной фильтрацией данных на тактическом уровне и периодическим переобучением для преодоления плато производительности, которое обычно ограничивает долгосрочное время после обучения. 2. Масштабирование времени вывода: улучшенная планировщиком многоагентная система поиска по дереву для иерархических рассуждений, которая масштабирует производительность во время вывода. BFS-Prover-V2 достигает 95,08% и 41,4% на тестовых наборах miniF2F и ProofNet соответственно, устанавливая новый уровень развития проверочных устройств поэтапного уровня. Этот репозиторий содержит модель BFS-Prover-V2-7B со следующими функциями: — Базовая модель: Qwen2.5-Math-7B — Подход к обучению: многоэтапная экспертная итерация с поиском по дереву по принципу «лучший первый» — Источники обучающих данных: — Mathlib (через LeanDojo) — Репозитории Lean-Github — Автоформализованная NuminaMath…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: ByteDance-Seed
Теги: qwen2, lean4, step-prover, conversational
Лайков: 7 | Загрузок: 392
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.