Hermes-2 Θ (Theta) 70B — это продолжение нашей экспериментальной объединенной модели, выпущенной Nous Research в сотрудничестве с Чарльзом Годдардом и Arcee AI, командой, создавшей MergeKit. Hermes-2 Θ представляет собой объединенную, а затем дополнительную версию RLHF нашей превосходной модели Hermes 2 Pro и модели Llama-3 Instruct от Meta, образующую новую модель Hermes-2 Θ, сочетающую в себе лучшее из обоих миров каждой модели. Hermes 2 Θ использует ChatML в качестве формата подсказок, открывая очень структурированную и управляемую многоходовую систему для вовлечения LLM в многоходовой диалог в чате. Системные подсказки обеспечивают управляемость и новые интересные способы взаимодействия с LLM, определяя правила, роли и стилистический выбор модели. Это более сложный формат, чем alpaca илиsharegpt, где добавлялись уникальные жетоны для обозначения начала и конца любого хода, а также роли для ходов. Модель также специально обучена для вызова функций, структурированного вывода с помощью JSON и извлечения функций из документов RAG (см. ниже). Вот пример приглашения с системными инструкциями (Используйте любое системное приглашение, это всего лишь пример!): Это приглашение доступно в виде шаблона чата, что означает, что вы можете форматировать сообщения…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: NousResearch
Теги: llama, distillation, synthetic data, function calling, structured outputs, json mode, conversational, en
Лайков: 80 | Загрузок: 1,755
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.