Подобное слияние 50/50, как и у других Magnum-Instruct, но с использованием вариантов модели, которые предварительно прошли дополнительную тренировку dpo/orpo. Пока не могу сказать, лучше это или нет по сравнению с использованием только оригинальных моделей, но во время моего ограниченного тестирования он показался достаточно хорошим, и сейчас его стоит загрузить в качестве альтернативы. Большое спасибо командам MistralAI и Anthracite за использованные оригинальные модели, а также nbeerbower за дополнительное обучение! — 8.0: https://huggingface.co/ParasiticRogue/Magnum-Instruct-DPO-12B-exl2-8.0-alt — 4.0: https://huggingface.co/ParasiticRogue/Magnum-Instruct-DPO-12B-exl2-4.0 https://huggingface.co/mradermacher/Magnum-Instruct-DPO-12B-GGUF https://huggingface.co/nbeerbower/mistral-nemo-gutenberg-12B-v3
Модальности:
Генерация текста
Области применения:
Следование инструкциям
Задача: Генерация текста
Автор: ParasiticRogue
Теги: mistral, merge, roleplay, not-for-all-audiences, text-generation-inference, endpoints_compatible
Лайков: 12 | Загрузок: 13
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.