Мы представляем Cat llama3 instruct, усовершенствованную модель llama 3 70b, ориентированную на быстроту реагирования системы, отзывчивость и вовлеченность персонажей. Модель направлена на максимальное соблюдение системных подсказок, предоставление полезной информации независимо от ситуаций и максимальное погружение персонажа (ролевая игра) в заданные сцены. Llama 3 70b представляет собой совершенно новую платформу, более информативную и управляемую, чем продукты предыдущих поколений. Однако в настоящее время для модели версии 70b отсутствуют универсальные настройки. Cat-llama3-instruct 70b направлен на устранение недостатков традиционных моделей путем применения жесткой фильтрации для повышения полезности, обобщения для точности системы/карточки персонажей и перефразирования для погружения в персонаж. Конкретные цели: Точность системных инструкций Цепочка мыслей (COT) Погружение персонажей Полезность для биологических и общих наук *Подготовка набора данных Систематически собирался набор данных Huggingface, содержащий пары инструкция-ответ. Мы обучили модель gpt исключительно ответам gpt4, чтобы она могла служить стандартной моделью. !image/png (Рис. 1. Распределение совокупности набора данных Huggingface и фильтрация для каждого компонента) Для каждой извлеченной записи…
Модальности:
Генерация текста
Области применения:
Диалог / чат Следование инструкциям
Задача: Генерация текста
Автор: turboderp
Теги: llama, conversational, text-generation-inference, endpoints_compatible
Лайков: 53 | Загрузок: 8,413
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.