Мы представляем 🦣 MAmmoTH, серию моделей больших языков (LLM) с открытым исходным кодом, специально предназначенных для решения общих математических задач. Модели MAmmoTH обучаются на 🤗 MathInstruct Dataset — тщательно подобранном наборе данных для настройки инструкций, который является легким, но поддающимся обобщению. MathInstruct составлен из 13 наборов данных по математическим обоснованиям, шесть из которых были недавно составлены в рамках этой работы. Он уникальным образом фокусируется на гибридном использовании обоснований цепочки мыслей (CoT) и программы мышления (PoT) и обеспечивает широкий охват различных математических областей. Модели обучаются на наборе данных 🤗 MathInstruct, который составлен из 13 различных наборов данных по математическим обоснованиям. Для получения более подробной информации ознакомьтесь с карточкой набора данных. Модели дорабатываются с помощью набора данных MathInstruct с использованием исходных моделей Llama-2 и Code Llama в качестве базовых. Процедура обучения различается для разных моделей в зависимости от их размеров. Ознакомьтесь с нашей статьей для получения более подробной информации. Модели оцениваются с использованием открытых математических задач и задач с множественным выбором из нескольких наборов данных. Вот результаты: Вы можете использовать модели через библиотеку Transformers Huggingface. Используйте функцию конвейера, чтобы создать конвейер генерации текста с…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: TIGER-Lab
Теги: llama, en, text-generation-inference, endpoints_compatible
Лайков: 9 | Загрузок: 16
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.