TIGER-Lab/MAmmoTH-13B

Мы представляем 🦣 MAmmoTH, серию моделей больших языков (LLM) с открытым исходным кодом, специально предназначенных для решения общих математических задач. Модели MAmmoTH обучаются на 🤗 MathInstruct Dataset — тщательно подобранном наборе данных для настройки инструкций, который является легким, но поддающимся обобщению. MathInstruct составлен из 13 наборов данных по математическим обоснованиям, шесть из которых были недавно составлены в рамках этой работы. Он уникальным образом фокусируется на гибридном использовании обоснований цепочки мыслей (CoT) и программы мышления (PoT) и обеспечивает широкий охват различных математических областей. Модели обучаются на наборе данных 🤗 MathInstruct, который составлен из 13 различных наборов данных по математическим обоснованиям. Для получения более подробной информации ознакомьтесь с карточкой набора данных. Модели дорабатываются с помощью набора данных MathInstruct с использованием исходных моделей Llama-2 и Code Llama в качестве базовых. Процедура обучения различается для разных моделей в зависимости от их размеров. Ознакомьтесь с нашей статьей для получения более подробной информации. Модели оцениваются с использованием открытых математических задач и задач с множественным выбором из нескольких наборов данных. Вот результаты: Вы можете использовать модели через библиотеку Transformers Huggingface. Используйте функцию конвейера, чтобы создать конвейер генерации текста с…

Модальности:
Генерация текста

Задача: Генерация текста
Автор: TIGER-Lab
Теги: llama, en, text-generation-inference, endpoints_compatible
Лайков: 9 | Загрузок: 16

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

hugging-quants/Llama-3.2-1B-Instruct-Q8_0-GGUF

LiquidAI/LFM2-350M-PII-Extract-JP

UNIVA-Bllossom/DeepSeek-llama3.3-Bllossom-70B

internlm/internlm2-1_8b