kappa-20b-131k-GGUF-Q8_0
Q80 квантовал GGUF kappa20b_131k для использования с llama.cpp и совместимыми механизмами вывода. Часть серии персон — набор экспериментальных...
Q80 квантовал GGUF kappa20b_131k для использования с llama.cpp и совместимыми механизмами вывода. Часть серии персон — набор экспериментальных...
Квантование GGUF meituan-longcat/LongCat-Flash-Lite для использования со специальной вилкой llama.cpp. > Требуется специальная вилка. В этой модели используется новая...
LFM2-24B-A2B-Preview в формате GGUF для использования с NexaSDK, с поддержкой вывода Qualcomm NPU, GPU и CPU. Этот репозиторий...
Это доработанная версия GLM-4.7-Flash-REAP-23B-A3B, созданная по заказу McG-221 с помощью механизма аблитерации Heretic (v1.1.0) компании P-E-W, объединенного с...
Этот репозиторий содержит файлы моделей формата GGUF для GLM-4.7-Flash от Zhipu AI. GLM-4.7-Flash — это высокоэффективная модель 30B-A3B...
Эта модель представляет собой сжатую версию Qwen/Qwen3-30B-A3B-Instruct-2507. Это достигается за счет сокращения количества экспертов на каждом уровне MoE...
Квантованная версия MiniMaxAI/MiniMax-M2.1 NVFP4 для эффективного вывода на графических процессорах NVIDIA Blackwell. — Формат: NVFP4 с двухуровневым масштабированием...
> [!TIP] > Поддержите эту работу → · X · GitHub · REAP paper · Cerebras REAP 𓌳...
ВНИМАНИЕ: версия «ЕРЕТИК»: разблокирована. НЕФИЛЬТРИРОВАННЫЙ. НФВ. Яркая проза. ИНТЕНСИВНЫЙ. Интуитивные детали. Светлый УЖАС. Ругаясь. БЕЗ ЦЕНЗУРЫ… юмор, романтика,...
Сопровождающий/издатель: Сьюзан Ачари Модель исходного кода: LiquidAI/LFM2-8B-A1B Этот репозиторий (8-битный MLX): mlx-community/LFM2-8B-A1B-8bit-MLX Этот репозиторий предоставляет оптимизированную для Apple-Silicon...