SanjiWatsuki/Kunoichi-DPO-7B

В этом репозитории размещен Kunoichi-DPO-7B, тонкая настройка DPO с использованием пар Intel Orca с шаблоном Alpaca на Kunoichi-7B. Данная модель ориентирована на общее использование. По моим тестам, он обладает более сильными способностями к рассуждению и следованию инструкциям, чем Куноичи-7B, но он может быть хуже для целей ролевой игры из-за соответствия набору данных Orca. Эта модель проходит тестирование производительности, и я обновлю страницу модели окончательными результатами. Модель предназначена для использования с контекстным окном размером до 8К. Используя альфа-версию NTK RoPE 2,6, модель можно использовать экспериментально до контекстного окна 16 КБ. Я нашел лучшие результаты SillyTavern, используя шаблон Noromaid. Кроме того, вот мой настоятельно рекомендуемый шаблон завершения текста. Вы можете настроить это, увеличив или уменьшив температуру min p, чтобы повысить креативность, или повысив min p, чтобы повысить стабильность. Больше ничего трогать не нужно!

Модальности:
Генерация текста

Задача: Генерация текста
Автор: SanjiWatsuki
Теги: mistral, text-generation-inference, endpoints_compatible
Лайков: 7 | Загрузок: 96

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

unity/inference-engine-phi-1_5

ayushutkarsh/t3

sophosympatheia/Strawberrylemonade-L3-70B-v1.2

maicomputer/vicuna