Метка: llama-cpp

Генерация текста

SixVolts/GLM-5.2-ewaste-edition-GGUF

Квантование Imatrix GGUF GLM-5.2 (всего 745B / ~40B активно, glm-dsa Arch, MoE в стиле DeepSeek с 256 маршрутизируемыми...

Генерация текста

KakTakOne/Huihui-gemma-4-12B-coder-fable5-composer2.5-v1-abliterated-GGUF

Квантование GGUF huihui-ai/Huihui-gemma-4-12B-coder-fable5-composer2.5-v1-abliterated — не прошедшая цензуры (удаленная), ориентированная на кодирование тонкая настройка Google Gemma 4 12B. GGUF-кванты...

Генерация текста

GestaltLabs/Ornstein-3.5-9B-V2-GGUF

Квантование GGUF GestaltLabs/Ornstein-3.5-9B-V2 — пост-обучение с подкреплением (V2) Ornstein 3.5 9B. Каждый квант имеет родственную контрольную сумму .sha256,...

Генерация текста

JohnRoger/VibeThinker-3B-Q8_0-GGUF

Эта модель была преобразована в формат GGUF из WeiboAI/VibeThinker-3B с использованием llama.cpp через пространство GGUF-my-repo ggml.ai. Более подробную...

Генерация текста

JetBrains/Mellum2-12B-A2.5B-Instruct-GGUF-Q6_K

Этот репозиторий содержит квантование GGUF Q6K JetBrains/Mellum2-12B-A2.5B-Instruct, готовое к работе с llama.cpp`, Ollama, LM Studio и другими GGUF-совместимыми...

Генерация текста

trjxter/Qwimi3.5-9B-Kimik2.6-Opus-Distill-MTP-GGUF

Qwimi3.5-9B-Kimik2.6-Opus-Distill-GGUF содержит квантованные версии GGUF Qwimi3.5-9B-Kimik2.6-Opus-Distill, доработку unsloth/Qwen3.5-9B, ориентированную на рассуждения. Эта модель была обучена как контролируемая точная...

Генерация текста

AtomicChat/gemma-4-E2B-it-assistant-GGUF

GGUF собирает google/gemma-4-E2B-it-assistant — официальный разработчик Gemma 4 Multi-Token Prediction (MTP) для google/gemma-4-E2B-it. Используйте его в качестве черновой...

Генерация текста

RDson/Qwen3.6-27B-MTP-IQ4_KS-GGUF

Это было сделано из Q80, а не напрямую из fp16, из-за этого могла быть потеряна некоторая* точность. Это...

Генерация текста

lordx64/Qwen3.6-35B-A3B-Kimi-K2.6-Reasoning-Distilled-GGUF

Квантование GGUF lordx64/Qwen3.6-35B-A3B-Kimi-K2.6-Reasoning-Distilled для использования с llama.cpp и LM Studio. Базовая модель представляет собой усовершенствованный вариант Qwen3.6-35B-A3B, доработанный...

Генерация текста

wangzhang/Qwen3.6-27B-abliterated-GGUF

Квантование GGUF для wangzhang/Qwen3.6-27B-удалено, Qwen3.6-27B с подавлением отказа на втором проходе (10/100 отказов, 15/15 жесткого соответствия, совокупный KL...