MN-CaptainErisNebula-12B-Chimera-v1.1-еретик-без цензуры-уничтоженный Точная настройка для использования Claude Opus 4.5 Высокое рассуждение/мышление: https://huggingface.co/DavidAU/MN-CaptainErisNebula-Chimera-v1.1-THINKING-ClaudeOpus4.5-12B-heretic-uncensored Метод, изобретенный «P-E-W», ищет лучшие настройки для децензурирования («уничтожения») модели методом проб и ошибок И гарантирует, что модель также не будет повреждена. «Дивергенция KL» — это эталон для оценки корневого состояния модели/состояния по умолчанию, где ноль соответствует идеальному состоянию. Обычно любое число меньше 1 является отличным, однако для меньших моделей очень важно иметь значение меньшее/близкое к нулю. НОЛЬ (или близко к нему: ниже 0,3 для небольших моделей [0,6B-3B]) означает, что модель работает так же хорошо, как и до процесса. Опять же, цель состоит в том, чтобы попытаться добраться до 0 или близко к нему, что является критическим, при этом ПЕРВЫМ обеспечением «расхождения KL» как можно ниже или нулевым. Целью является «процент отказов» 20 или ниже, при этом НОЛЬ является идеальным. Сокращение «процента отказов» имеет и дополнительные положительные побочные эффекты. Сначала я выбираю наименьшую возможную «дивергенцию KL», а затем — лучший «коэффициент отказов». С немного более высоким «процентом отказов» справиться намного легче, чем с моделью «повреждения мозга».…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: DavidAU
Теги: mistral, heretic, uncensored, decensored, abliterated, finetune, creative, creative writing
Лайков: 10 | Загрузок: 24
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.