jondurbin/airoboros-33b-gpt4-1.4

Это модель LlaMa с точной настройкой 33b параметров qlora, использующая полностью синтетические данные обучения, созданные gpt4 через https://github.com/jondurbin/airoboros. В основном это расширение предыдущей серии gpt-4 с некоторыми дополнениями: исправлены (+ больше примеров) примеры кодирования многосимвольных многоповоротных разговоров на 10 языках из набора данных Rosettacode.org благодаря Майку, также известному как kryptkpr: https://huggingface.co/datasets/mike-ravkine/rosettacode-parsed больше примеров ролевых игр шутки загадки все инструкции по кодированию теперь имеют эквивалентную версию «PLAINFORMAT» (и все примеры rosettacode были обучены с помощью PLAINFORMAT). Другими словами, это преамбула/системное приглашение, за которым следует один пробел, затем «USER:» (один пробел после двоеточия), а затем приглашение (которое может состоять из нескольких строк). пробелы, что угодно), затем один пробел, а затем «АССИСТЕНТ:» (с одним пробелом после двоеточия). Чтобы запустить полную точность/родную версию pytorch, вы можете использовать мою вилку FastChat, которая в основном такая же, но допускает многострочные запросы, а также опцию —no-history для предотвращения ошибок токенизации ввода. Затем вы можете вызвать его следующим образом (после загрузки модели): Для многооборотного…

Модальности:
Генерация текста

Задача: Генерация текста
Автор: jondurbin
Теги: llama, text-generation-inference, endpoints_compatible
Лайков: 14 | Загрузок: 805

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Trelis/Llama-2-7b-chat-hf-function-calling-v3

totally-not-an-llm/EverythingLM-13b-16k

deepseek-ai/deepseek-moe-16b-chat

huihui-ai/Huihui-Qwen3-235B-A22B-abliterated-Q4_K_M-GGUF