ParasiticRogue/Magnum-Instruct-DPO-12B

Подобное слияние 50/50, как и у других Magnum-Instruct, но с использованием вариантов модели, которые предварительно прошли дополнительную тренировку dpo/orpo. Пока не могу сказать, лучше это или нет по сравнению с использованием только оригинальных моделей, но во время моего ограниченного тестирования он показался достаточно хорошим, и сейчас его стоит загрузить в качестве альтернативы. Большое спасибо командам MistralAI и Anthracite за использованные оригинальные модели, а также nbeerbower за дополнительное обучение! — 8.0: https://huggingface.co/ParasiticRogue/Magnum-Instruct-DPO-12B-exl2-8.0-alt — 4.0: https://huggingface.co/ParasiticRogue/Magnum-Instruct-DPO-12B-exl2-4.0 https://huggingface.co/mradermacher/Magnum-Instruct-DPO-12B-GGUF https://huggingface.co/nbeerbower/mistral-nemo-gutenberg-12B-v3

Модальности:
Генерация текста

Области применения:
Следование инструкциям

Задача: Генерация текста
Автор: ParasiticRogue
Теги: mistral, merge, roleplay, not-for-all-audiences, text-generation-inference, endpoints_compatible
Лайков: 12 | Загрузок: 13

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

jondurbin/airoboros-65b-gpt4-1.4

MaziyarPanahi/gemma-7b-it-GGUF

inclusionAI/Ring-flash-linear-2.0

PORTULAN/gervasio-7b-portuguese-ptpt-decoder