XtraGPT — это семейство моделей больших языков (LLM) с открытым исходным кодом, разработанных специально для совместной работы над научными статьями между человеком и искусственным интеллектом. В отличие от моделей общего назначения, которые часто выполняют полировку на уровне поверхности, XtraGPT настроен так, чтобы понимать весь контекст исследовательской работы и выполнять конкретные инструкции по доработке на основе критериев. Модели были обучены на наборе данных из 140 000 высококачественных пар «инструкция-ревизия», полученных из документов конференций высшего уровня (ICLR). Ключевые особенности: С учетом контекста: обрабатывает весь контекст документа, чтобы гарантировать соответствие изменений общему повествованию. Управляемый: следует конкретным инструкциям пользователя в соответствии с 20 критериями академического письма в 6 разделах (Аннотация, Введение и т. д.). Итеративный рабочий процесс:** предназначен для поддержки жизненного цикла «Совместная работа человека и искусственного интеллекта» (HAC), при котором авторы сохраняют творческий контроль. Доступные размеры моделей: 1.5B (на основе Qwen/Qwen2.5-1.5B-Instruct) 3B (на основе Meta-llama/Llama-3.2-3B-Instruct) 7B (на основе Qwen/Qwen2.5-7B-Instruct) 14B (на основе microsoft/phi-4) XtraGPT совместим с vLLM для обеспечения вывода с высокой пропускной способностью. Эта модель выпущена под лицензией ModelGo Zero License 2.0…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: Xtra-Computing
Теги: chat, zho, eng, fra, spa, por, deu, ita
Лайков: 8 | Загрузок: 1,563
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.