bartowski/kldzj_gpt-oss-120b-heretic-GGUF

Исходная модель: https://huggingface.co/kldzj/gpt-oss-120b-heretic. Все кванты сделаны с использованием опции imatrix с набором данных отсюда в сочетании с подмножеством Combinallsmall.parquet от Эда Аддарио здесь. Запускайте их напрямую с помощью llama.cpp или любого другого проекта на основе llama.cpp. Шаблон чата не указан, поэтому используется по умолчанию. Это может быть неверно. Подробную информацию см. в карточке оригинальной модели. Некоторые из этих квантов (Q3KXL, Q4KL и т. д.) представляют собой стандартный метод квантования, в котором вложения и выходные веса квантуются до Q8_0 вместо того, что обычно используется по умолчанию. Если модель больше 50 ГБ, она будет разделена на несколько файлов. Чтобы загрузить их все в локальную папку, запустите: Вы можете либо указать новый локальный каталог (kldzjgpt-oss-120b-heretic-Q80), либо загрузить их все на месте (./). Раньше вы загружали Q4044/48/8_8, и их веса чередовались в памяти, чтобы повысить производительность на машинах ARM и AVX за счет загрузки большего количества данных за один проход. Однако сейчас существует так называемая «онлайн-переупаковка» весов. подробности в этом PR. Если вы используете Q4_0 и ваше оборудование выиграет от переупаковки весов, оно сделает это автоматически на лету. Как…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: bartowski
Теги: gguf, vllm, heretic, uncensored, decensored, abliterated, mxfp4, endpoints_compatible
Лайков: 20 | Загрузок: 368

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

ChaoticNeutrals/Nyan-Stunna-7B

ECNU-SEA/SEA-E

garage-bAInd/Camel-Platypus2-70B

deucebucket/Qwen3.6-27B-Cerebellum-GGUF