huihui-ai/Huihui-gpt-oss-20b-BF16-abliterated-v2

Эта модель представляет собой доработанную версию huihui-ai/Huihui-gpt-oss-20b-BF16-abliterated. Он был обучен с использованием TRL. Для точной настройки и квантования обратитесь к разделу «Обучение с учетом квантования» (QAT) (huihui-ai/Huihui-gpt-oss-20b-mxfp4-abliterated-v2). Использование huihui-ai/Huihui-gpt-oss-20b-BF16-abliterated для создания набора данных для вредоносных инструкций. Преимущества: Все основные показатели (Потери/Ускорение/Энтропия) улучшаются синхронно, с небольшим разрывом между Eval и Train (Потенциальные проблемы: Повышение Grad Norm на более поздних этапах может быть вызвано отсутствием снижения скорости обучения или пакетного шума; рекомендуется проверять журналы на наличие признаков градиентного взрыва. Вы можете напрямую использовать huihuiai/gpt-oss-abliterated:20b-v2-q4K_M, llama.cpp-b6115 теперь поддерживает преобразование в формат GGUF и может быть протестирован с помощью llama-cli — TRL: 0.23.0 — Transformers: 4.57.0.dev0 — Pytorch: 2.8.0+cu128 — Наборы данных: 4.0.0 — Токенизаторы: 0.22.0 — Риск конфиденциальных или противоречивых выходных данных: фильтрация безопасности этой модели. было значительно сокращено, что потенциально может создавать конфиденциальный, противоречивый или неприемлемый контент. Пользователям следует проявлять осторожность и тщательно проверять созданные результаты. — Не подходит для всех аудиторий: из-за…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: huihui-ai
Теги: gguf, gpt_oss, vllm, generated_from_trainer, trl, sft, abliterated, uncensored
Лайков: 38 | Загрузок: 7,722

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

rombodawg/Everyone-Coder-33b-Base

beowolx/MistralHermes-CodePro-7B-v1

floriangardin/musiclang

google/gemma-2-2b-jpn-it