BTLM-3B-8k-chat — это чат-версия базовой модели BTLM-3B-8K, обученная с использованием метода DPO на наборе данных Anthropic-HH-RLHF. Модель была специально обучена с учетом предпочтений человека и оптимизирована для сценариев использования диалога. BTLM-3B-8k-чат: — Лицензия для коммерческого использования (Apache 2.0). — Улучшение на +2,26 % по 10 последующим задачам и MMLU по сравнению с базовой моделью BTLM. — Улучшены возможности чата. — Снижение безвредности и повышение полезности. !figure1image Рис. 1. Сравнение производительности с базовой моделью при выполнении 11 задач. !table1image Таблица 1: Подробное сравнение последующих задач. О производительности задачи MMLU сообщается с использованием 5-кадровой обработки, для остальных задач — 0-кадровой. — Структура TRL для обучения DPO — Скорость обучения: 5e-5 — Размер пакета: 64 — 1 эпоха — Отсев: 0 — Лора r: 128 — Лора альфа: 16 — Бета: 0,05 — Дополнительная информация: блог BTLM-3B-8k-chat Основное назначение — дальнейшее исследование больших языковых моделей. BTLM-3B-8k-chat можно использовать в качестве базовой модели для исследований НЛП, приложений, этики и мировоззрения. Мы выпускаем эту модель с полностью разрешающей лицензией Apache, чтобы сообщество могло свободно использовать ее. Вы можете точно настроить и адаптировать модель чата BTLM-3B-8k с помощью Cerebras Model Studio или стороннего…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: cerebras
Теги: btlm, causal-lm, Cerebras, BTLM, custom_code, en
Лайков: 14 | Загрузок: 30
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.