ServiceNow-AI/Apriel-5B-Instruct - Каталог нейросетей
Генерация текста

ServiceNow-AI/Apriel-5B-Instruct

Добавлено:
ServiceNow-AI/Apriel-5B-Instruct

1. Краткое описание модели 2. Оценка 3. Использование по назначению 4. Ограничения 5. Безопасность и ответственное использование 6. Лицензия 7. Citation Apriel — это семейство моделей, созданных для универсальности, обеспечивающих высокую производительность и эффективность при выполнении широкого круга задач. База April-5B — это преобразователь, предназначенный только для декодера, обученный на токенах данных 4,5T+. Это первая версия семейства моделей Aprile, предназначенная для поддержки исследований моделей фундаментов. База April-5B демонстрирует высокие показатели в общих тестах для моделей с параметрами 5B. Apriel-5B-Instruct построен на базе Apriel-5B с использованием непрерывного предварительного обучения (CPT), контролируемой точной настройки (SFT) и согласования после обучения с DPO и RLVR. Как этапы CPT, так и SFT включали обучение нескольким предметно-предвзятым вариантам с перекрывающимися наборами данных (например, инструкциями, кодом, математикой). Затем они были объединены для формирования модели более общего назначения перед согласованием. Окончательная модель предназначена для следования инструкциям, рассуждений и диалога, ориентированного на безопасность. По оси Y показаны средние показатели производительности нисходящего сегмента. Пропускная способность (ось X) измерялась с использованием vLLM с размером пакета 8, 256 входными токенами и 32 выходными токенами. Если системное сообщение не предоставлено, модель вставляет…

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям


Задача: Генерация текста
Автор: ServiceNow-AI
Теги: apriel, conversational, custom_code, en
Лайков: 53  |  Загрузок: 2,566

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.