OpenMath-Nemotron-14B создан путем тонкой настройки Qwen/Qwen2.5-14B на наборе данных OpenMathReasoning. Данная модель готова к коммерческому использованию. Модели OpenMath-Nemotron достигают самых современных результатов в популярных математических тестах. Мы представляем показатели в виде pass@1 (maj@64), где pass@1 — это средняя точность для 64 поколений, а maj@64 — результат голосования большинства. Более подробную информацию о настройке оценки см. в нашей статье. Мы использовали версию модели OpenMath-Nemotron-14B, чтобы занять первое место в соревновании AIMO-2 Kaggle! Конвейер, который мы использовали для создания данных и моделей, полностью открыт! Мы предоставляем все инструкции для полного воспроизведения наших результатов, включая генерацию данных. Наши модели можно использовать в трех режимах вывода: цепочка мыслей (CoT), инструментально-интегрированное рассуждение (TIR) и генеративный выбор решения (GenSelect). Чтобы запустить вывод в режиме CoT, вы можете использовать этот пример фрагмента кода. Чтобы выполнить вывод в режимах TIR или GenSelect, мы настоятельно рекомендуем использовать нашу эталонную реализацию в NeMo-Skills. Обратите внимание, что эти модели не были настроены на общие данные и поэтому не могут дать хороших ответов за пределами математической области. РЕГУЛИРУЮЩИЕ ТЕРМИНЫ: Используйте…
Модальности:
Генерация текста
Области применения:
Математика Диалог / чат
Задача: Генерация текста
Автор: nvidia
Теги: qwen2, nvidia, math, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 17 | Загрузок: 180
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.