deepseek-ai/DeepSeek-Math-V2 - Каталог нейросетей
Генерация текста

deepseek-ai/DeepSeek-Math-V2

Добавлено:
deepseek-ai/DeepSeek-Math-V2

Большие языковые модели добились значительного прогресса в математических рассуждениях, которые служат важным испытательным стендом для ИИ и могут повлиять на научные исследования, если они будут развиваться дальше. Благодаря масштабированию рассуждений с помощью обучения с подкреплением, которое вознаграждает за правильные окончательные ответы, LLM за один год улучшили свои результаты: от плохих результатов до насыщения соревнований по количественному рассуждению, таких как AIME и HMMT. Однако этот подход сталкивается с фундаментальными ограничениями. Стремление к повышению точности окончательного ответа не решает ключевую проблему: правильные ответы не гарантируют правильных рассуждений. Более того, многие математические задачи, такие как доказательство теорем, требуют строгого пошагового вывода, а не числовых ответов, что делает вознаграждение за окончательный ответ неприменимым. Мы считаем, что для расширения границ глубоких рассуждений необходимо проверить полноту и строгость математических рассуждений. Самопроверка особенно важна для масштабирования вычислений во время тестирования, особенно для открытых задач без известных решений. В направлении самопроверяемых математических рассуждений мы исследуем, как обучить точного и достоверного верификатора на основе LLM для доказательства теорем. Затем мы обучаем генератор доказательств, используя в качестве награды верификатор…

Модальности:
Генерация текста

Области применения:
Диалог / чат Математика


Задача: Генерация текста
Автор: deepseek-ai
Теги: deepseek_v32, conversational, endpoints_compatible, fp8
Лайков: 684  |  Загрузок: 8,708

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.