NuminaMath — это серия языковых моделей, которые обучаются с помощью двух этапов контролируемой тонкой настройки для решения математических задач с использованием цепочки мыслей (CoT) и интегрированного с инструментами рассуждения (TIR): Этап 1: точная настройка базовой модели на большом, разнообразном наборе данных математических задач и решений на естественном языке, где каждое решение шаблонируется с помощью цепочки мыслей (CoT) для облегчения рассуждения. Этап 2: точная настройка модели, полученной на этапе 1, на синтетическом наборе данных интегрированных с инструментами рассуждений, где каждая математическая задача разлагается на последовательность обоснований, программ Python и их результатов. NuminaMath 72B CoT — это модель этапа 1, которая была доработана на AI-MO/NuminaMath-CoT, крупномасштабном наборе данных, содержащем более 860 тысяч пар задач и решений математических соревнований. — Тип модели: математический LLM с 72B параметрами, точно настроенный на наборе данных с более чем 860 тысячами пар математических задач и решений. — Язык(и) (NLP): преимущественно английский — Лицензия: Tongyi Qianwen — Точная настройка на основе модели: Qwen/Qwen2-72B — Репозиторий: https://github.com/project-numina/aimo-progress-prize Вот как вы можете запустить модель с помощью функции конвейера() из 🤗 Трансформеры: NuminaMath 72B CoT был создан для решения проблем в узкой области уровня соревнований…
Модальности:
Генерация текста
Области применения:
Математика Диалог / чат
Задача: Генерация текста
Автор: AI-MO
Теги: qwen2, math, aimo, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 7 | Загрузок: 26
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.