Еще одна экспериментальная модель, использующая в основном синтетические данные, сгенерированные airoboros. В этой модели используется формат чата ламы-2, а не пользователь/помощник в стиле викуньи! Это критическое изменение, хотя большинство систем вывода поддерживают шаблоны чата llama-2. Модель, построенная на наборе данных airoboros-3.1, который является продолжением набора данных airoboros-3.0 со следующими дополнениями: Больше MathJSON, теперь ~17 тыс. элементов — математические вопросы с префиксом «Создайте решение MathJSON для следующего:», который затем выводит JSON между тегами и, который можно проанализировать и передать в детерминированную библиотеку для выполнения вычислений. Извлечение информации из журналов (например, получение списка путей/IP-адресов и т. д. из журналов Apache). Анонимизация, например. удаление имен, IP-адресов и/или дат из текста. Самоанализ чата — многоходовые чаты, в которые вводятся случайные вопросы об описаниях персонажа, настройках чата или ранее сказанных вещах, чтобы убедиться, что модель использует системные подсказки и/или историю чата. Многошаговые инструкции с подтверждением (см. ниже) Данные без цензуры (не опубликованы) Это модель довольно общего назначения, но в ней основное внимание уделяется следованию инструкциям, а не…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: jondurbin
Теги: llama, conversational, text-generation-inference, endpoints_compatible
Лайков: 6 | Загрузок: 96
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.