См. также эту модель с немного более высоким процентом отказов (17/100), но с гораздо лучшим показателем KL Divergence (0,09). https://huggingface.co/DavidAU/gemma-3-1b-it-heretic-abliterated-uncensored Метод, изобретенный «P-E-W», ищет лучшие настройки для децензурирования («уничтожения») модели методом проб и ошибок И гарантирует, что модель тоже не будет повреждена. «Дивергенция KL» — это эталон для оценки корневого состояния модели/состояния по умолчанию, где ноль соответствует идеальному состоянию. Обычно любое число меньше 1 является отличным, однако для меньших моделей очень важно иметь значение меньшее/близкое к нулю. НОЛЬ (или близко к нему: ниже 0,3 для небольших моделей) означает, что модель работает так же, как и до процесса. Опять же, цель состоит в том, чтобы попытаться добраться до 0 или близко к нему, что является критическим, при этом ПЕРВЫМ обеспечением «расхождения KL» как можно ниже или нулевым. Целью является «процент отказов» 20 или ниже, при этом НОЛЬ является идеальным. Сокращение «процента отказов» имеет и дополнительные положительные побочные эффекты. Сначала я выбираю наименьшую возможную «дивергенцию KL», а затем — лучший «коэффициент отказов». С немного более высоким «процентом отказов» справиться гораздо легче, чем с моделью «повреждения мозга». Обычно, когда вы просите модель создавать контент ужасов, ругательств или контента с рейтингом X…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: DavidAU
Теги: gemma3_text, heretic, uncensored, decensored, abliterated, finetune, conversational, text-generation-inference
Лайков: 26 | Загрузок: 747
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.