Эта модель представляет собой доработанную версию huihui-ai/Huihui-gpt-oss-20b-BF16-abliterated. Он был обучен с использованием TRL. Для точной настройки и квантования обратитесь к разделу «Обучение с учетом квантования» (QAT) (huihui-ai/Huihui-gpt-oss-20b-mxfp4-abliterated-v2). Использование huihui-ai/Huihui-gpt-oss-20b-BF16-abliterated для создания набора данных для вредоносных инструкций. Преимущества: Все основные показатели (Потери/Ускорение/Энтропия) улучшаются синхронно, с небольшим разрывом между Eval и Train (Потенциальные проблемы: Повышение Grad Norm на более поздних этапах может быть вызвано отсутствием снижения скорости обучения или пакетного шума; рекомендуется проверять журналы на наличие признаков градиентного взрыва. Вы можете напрямую использовать huihuiai/gpt-oss-abliterated:20b-v2-q4K_M, llama.cpp-b6115 теперь поддерживает преобразование в формат GGUF и может быть протестирован с помощью llama-cli — TRL: 0.23.0 — Transformers: 4.57.0.dev0 — Pytorch: 2.8.0+cu128 — Наборы данных: 4.0.0 — Токенизаторы: 0.22.0 — Риск конфиденциальных или противоречивых выходных данных: фильтрация безопасности этой модели. было значительно сокращено, что потенциально может создавать конфиденциальный, противоречивый или неприемлемый контент. Пользователям следует проявлять осторожность и тщательно проверять созданные результаты. — Не подходит для всех аудиторий: из-за…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: huihui-ai
Теги: gguf, gpt_oss, vllm, generated_from_trainer, trl, sft, abliterated, uncensored
Лайков: 38 | Загрузок: 7,722
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.