Это модель LlaMa с точной настройкой 33b параметров qlora, использующая полностью синтетические данные обучения, созданные gpt4 через https://github.com/jondurbin/airoboros. В основном это расширение предыдущей серии gpt-4 с некоторыми дополнениями: исправлены (+ больше примеров) примеры кодирования многосимвольных многоповоротных разговоров на 10 языках из набора данных Rosettacode.org благодаря Майку, также известному как kryptkpr: https://huggingface.co/datasets/mike-ravkine/rosettacode-parsed больше примеров ролевых игр шутки загадки все инструкции по кодированию теперь имеют эквивалентную версию «PLAINFORMAT» (и все примеры rosettacode были обучены с помощью PLAINFORMAT). Другими словами, это преамбула/системное приглашение, за которым следует один пробел, затем «USER:» (один пробел после двоеточия), а затем приглашение (которое может состоять из нескольких строк). пробелы, что угодно), затем один пробел, а затем «АССИСТЕНТ:» (с одним пробелом после двоеточия). Чтобы запустить полную точность/родную версию pytorch, вы можете использовать мою вилку FastChat, которая в основном такая же, но допускает многострочные запросы, а также опцию —no-history для предотвращения ошибок токенизации ввода. Затем вы можете вызвать его следующим образом (после загрузки модели): Для многооборотного…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: jondurbin
Теги: llama, text-generation-inference, endpoints_compatible
Лайков: 14 | Загрузок: 805
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.