Модели OpenMath были разработаны для решения математических задач путем интеграции текстовых рассуждений с блоками кода, выполняемыми интерпретатором Python. Модели были обучены на OpenMathInstruct-1, наборе данных для настройки математических инструкций с 1,8 млн пар «задача-решение», созданных с использованием лицензированной модели Mixtral-8x7B. жадное большинство@50 модель GSM8K MATH GMS8K MATH OpenMath-CodeLlama-7B (nemo | HF) 75,9 43,6 84,8 55,6 OpenMath-Mistral-7B (nemo | HF) 80,2 44,5 86,9 57,2 OpenMath-CodeLlama-13B (nemo | HF) 78,8 45,5 86,8 57,6 OpenMath-CodeLlama-34B (nemo | HF) 80,7 48,3 88,0 60,2 OpenMath-Llama2-70B (nemo | HF) 84,7 46,3 90,1 58,3 OpenMath-CodeLlama-70B (nemo | HF) 84,6 50,7 90,8 60,4 Конвейер, который мы использовали для создания этих моделей, полностью открыт! Попробуйте выполнить логический вывод с помощью наших моделей всего с помощью нескольких команд! Чтобы улучшить другие модели или узнать больше о нашем коде, прочтите документацию ниже. — Конвейер NeMo-Skills — Генерация синтетических данных — Точная настройка моделей — Оценка моделей В нашем конвейере мы используем NVIDIA NeMo, комплексную облачную среду для создания, настройки и развертывания генеративных моделей ИИ в любом месте. Он включает в себя системы обучения и вывода,…
Модальности:
Генерация текста
Области применения:
Генерация кода Математика
Задача: Генерация текста
Автор: nvidia
Теги: mistral, nvidia, code, math, en, text-generation-inference, endpoints_compatible
Лайков: 35 | Загрузок: 132
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.