Точная настройка DPO нашей модели MetaMath SFT на наборе данных Truthy DPO
Модальности:
Генерация текста
Области применения:
Диалог / чат Математика
Задача: Генерация текста
Автор: abacusai
Теги: llama, conversational, text-generation-inference, endpoints_compatible
Лайков: 15 | Загрузок: 139
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.