NousResearch/Hermes-2-Theta-Llama-3-70B

Hermes-2 Θ (Theta) 70B — это продолжение нашей экспериментальной объединенной модели, выпущенной Nous Research в сотрудничестве с Чарльзом Годдардом и Arcee AI, командой, создавшей MergeKit. Hermes-2 Θ представляет собой объединенную, а затем дополнительную версию RLHF нашей превосходной модели Hermes 2 Pro и модели Llama-3 Instruct от Meta, образующую новую модель Hermes-2 Θ, сочетающую в себе лучшее из обоих миров каждой модели. Hermes 2 Θ использует ChatML в качестве формата подсказок, открывая очень структурированную и управляемую многоходовую систему для вовлечения LLM в многоходовой диалог в чате. Системные подсказки обеспечивают управляемость и новые интересные способы взаимодействия с LLM, определяя правила, роли и стилистический выбор модели. Это более сложный формат, чем alpaca илиsharegpt, где добавлялись уникальные жетоны для обозначения начала и конца любого хода, а также роли для ходов. Модель также специально обучена для вызова функций, структурированного вывода с помощью JSON и извлечения функций из документов RAG (см. ниже). Вот пример приглашения с системными инструкциями (Используйте любое системное приглашение, это всего лишь пример!): Это приглашение доступно в виде шаблона чата, что означает, что вы можете форматировать сообщения…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: NousResearch
Теги: llama, distillation, synthetic data, function calling, structured outputs, json mode, conversational, en
Лайков: 80 | Загрузок: 1,755

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

JetBrains/CodeLlama-7B-KStack

TheBloke/airoboros-l2-70B-GPT4-2.0-GPTQ

unsloth/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

SupraLabs/Supra-50M-Base