OpenMath-Nemotron-14B-Kaggle создается путем тонкой настройки Qwen/Qwen2.5-14B на подмножестве набора данных OpenMathReasoning. Эта модель была использована в нашем первом конкурсе AIMO-2 Kaggle! Модели OpenMath-Nemotron достигают самых современных результатов в популярных математических тестах. Мы представляем метрики в виде pass@1 (maj@64), где pass@1 — это средняя точность для 64 поколений, а maj@64 — результат голосования большинства. Более подробную информацию о настройке оценки см. в нашей статье. Конвейер, который мы использовали для создания данных и моделей, полностью открыт! Мы предоставляем все инструкции для полного воспроизведения наших результатов, включая генерацию данных. Эта модель всегда будет использовать выполнение кода для решения математических задач, поэтому мы настоятельно рекомендуем выполнить вывод с помощью нашей эталонной реализации в NeMo-Skills. Обратите внимание, что эти модели не были настроены на общие данные и поэтому не могут дать хороших ответов за пределами математической области. РЕГУЛИРУЮЩИЕ УСЛОВИЯ: Использование этой модели регулируется CC-BY-4.0. Дополнительная информация: Лицензия Apache версии 2.0. Эта модель предназначена для облегчения исследований в области математических рассуждений. Тип архитектуры: только трансформаторный декодер…
Модальности:
Генерация текста
Области применения:
Математика Диалог / чат
Задача: Генерация текста
Автор: nvidia
Теги: qwen2, nvidia, math, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 20 | Загрузок: 419
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.