GLM-5.2-ewaste-edition-GGUF
Квантование Imatrix GGUF GLM-5.2 (всего 745B / ~40B активно, glm-dsa Arch, MoE в стиле DeepSeek с 256 маршрутизируемыми...
Квантование Imatrix GGUF GLM-5.2 (всего 745B / ~40B активно, glm-dsa Arch, MoE в стиле DeepSeek с 256 маршрутизируемыми...
Квантование GGUF huihui-ai/Huihui-gemma-4-12B-coder-fable5-composer2.5-v1-abliterated — не прошедшая цензуры (удаленная), ориентированная на кодирование тонкая настройка Google Gemma 4 12B. GGUF-кванты...
Квантование GGUF GestaltLabs/Ornstein-3.5-9B-V2 — пост-обучение с подкреплением (V2) Ornstein 3.5 9B. Каждый квант имеет родственную контрольную сумму .sha256,...
Эта модель была преобразована в формат GGUF из WeiboAI/VibeThinker-3B с использованием llama.cpp через пространство GGUF-my-repo ggml.ai. Более подробную...
Этот репозиторий содержит квантование GGUF Q6K JetBrains/Mellum2-12B-A2.5B-Instruct, готовое к работе с llama.cpp`, Ollama, LM Studio и другими GGUF-совместимыми...
Qwimi3.5-9B-Kimik2.6-Opus-Distill-GGUF содержит квантованные версии GGUF Qwimi3.5-9B-Kimik2.6-Opus-Distill, доработку unsloth/Qwen3.5-9B, ориентированную на рассуждения. Эта модель была обучена как контролируемая точная...
GGUF собирает google/gemma-4-E2B-it-assistant — официальный разработчик Gemma 4 Multi-Token Prediction (MTP) для google/gemma-4-E2B-it. Используйте его в качестве черновой...
Это было сделано из Q80, а не напрямую из fp16, из-за этого могла быть потеряна некоторая* точность. Это...
Квантование GGUF lordx64/Qwen3.6-35B-A3B-Kimi-K2.6-Reasoning-Distilled для использования с llama.cpp и LM Studio. Базовая модель представляет собой усовершенствованный вариант Qwen3.6-35B-A3B, доработанный...
Квантование GGUF для wangzhang/Qwen3.6-27B-удалено, Qwen3.6-27B с подавлением отказа на втором проходе (10/100 отказов, 15/15 жесткого соответствия, совокупный KL...