deepseek-ai/DeepSeek-Math-V2

Большие языковые модели добились значительного прогресса в математических рассуждениях, которые служат важным испытательным стендом для ИИ и могут повлиять на научные исследования, если они будут развиваться дальше. Благодаря масштабированию рассуждений с помощью обучения с подкреплением, которое вознаграждает за правильные окончательные ответы, LLM за один год улучшили свои результаты: от плохих результатов до насыщения соревнований по количественному рассуждению, таких как AIME и HMMT. Однако этот подход сталкивается с фундаментальными ограничениями. Стремление к повышению точности окончательного ответа не решает ключевую проблему: правильные ответы не гарантируют правильных рассуждений. Более того, многие математические задачи, такие как доказательство теорем, требуют строгого пошагового вывода, а не числовых ответов, что делает вознаграждение за окончательный ответ неприменимым. Мы считаем, что для расширения границ глубоких рассуждений необходимо проверить полноту и строгость математических рассуждений. Самопроверка особенно важна для масштабирования вычислений во время тестирования, особенно для открытых задач без известных решений. В направлении самопроверяемых математических рассуждений мы исследуем, как обучить точного и достоверного верификатора на основе LLM для доказательства теорем. Затем мы обучаем генератор доказательств, используя в качестве награды верификатор…

Модальности:
Генерация текста

Области применения:
Диалог / чат Математика

Задача: Генерация текста
Автор: deepseek-ai
Теги: deepseek_v32, conversational, endpoints_compatible, fp8
Лайков: 684 | Загрузок: 8,708

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

mlx-community/Nemotron-Cascade-2-30B-A3B-4bit

dphn/Dolphin3.0-Mistral-24B

Nitral-AI/Poppy_Porpoise-1.0-L3-8B

pe4enov/ruGPT-3.5-13B-8bit