Это доработанная версия Harbinger-24B, созданная с помощью механизма аблитерации Heretic (v1.1.0) компании P-E-W, объединенного с PR-системой ортогональной абляции с сохранением величины. Как и наша линейка тонких настроек Wayfarer, Harbinger-24B был разработан для захватывающих приключений и других историй, где последствия кажутся реальными и каждое решение имеет значение. Обучение было сосредоточено на улучшении следования инструкциям, улучшении продолжения в середине последовательности и усилении связности повествования в длинных последовательностях результатов без вмешательства пользователя. Те же методы DPO (оптимизация прямых предпочтений), которые использовались в нашей модели Muse, были применены к Harbinger, в результате чего были получены безупречные результаты с меньшим количеством клише, повторяющихся шаблонов и других распространенных артефактов. Если вы хотите легко опробовать эту модель, вы можете сделать это на https://aidungeon.com. Обратите внимание, что для Harbinger требуется подписка, а Muse и Wayfarer Small бесплатны. Мы планируем продолжать совершенствовать и открывать исходный код аналогичных моделей, поэтому, пожалуйста, делитесь своими отзывами о том, как мы можем улучшить поведение моделей. Ниже мы поделимся более подробной информацией о том, как была создана Muse. Обучение Harbinger 24B проходило в два этапа на базе Mistral Small 3.1 Instruct. SFT — Различные многооборотные наборы данных из множества…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: MuXodious
Теги: mistral, text adventure, roleplay, heretic, uncensored, decensored, abliterated, conversational
Лайков: 9 | Загрузок: 83
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.