E1-AceReason-14B — это языковая модель, доработанная на основе AceReason-Nemotron-14B. Она обучена гибкому рассуждению с помощью стратегии развертывания с ограниченным бюджетом, интегрированной в GRPO, которая учит модель адаптивно рассуждать, когда мыслительный процесс прерывается, и эффективно обобщает невидимые бюджетные ограничения без дополнительного обучения. Этот выпуск предназначен только для исследовательских целей в поддержку научной статьи. Наши модели, наборы данных и код специально не разрабатываются и не оцениваются для всех последующих целей. Мы настоятельно рекомендуем пользователям оценить и устранить потенциальные проблемы, связанные с точностью, безопасностью и справедливостью, прежде чем развертывать эту модель. Мы призываем пользователей учитывать общие ограничения ИИ, соблюдать применимые законы и использовать лучшие практики при выборе вариантов использования, особенно для сценариев высокого риска, когда ошибки или неправильное использование могут существенно повлиять на жизнь, права или безопасность людей. Дополнительные рекомендации по вариантам использования см. в наших AUP и AI AUP.
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: Salesforce
Теги: qwen2, conversational, text-generation-inference, endpoints_compatible
Лайков: 12 | Загрузок: 44
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.