MiniMax-M2.7-NVFP4
Квантование MiniMaxAI/MiniMax-M2.7 высокого качества NVFP4 для графических процессоров NVIDIA Blackwell. 5000 калибровочных образцов в 5 различных наборах данных....
Квантование MiniMaxAI/MiniMax-M2.7 высокого качества NVFP4 для графических процессоров NVIDIA Blackwell. 5000 калибровочных образцов в 5 различных наборах данных....
Модель NVIDIA Qwen3-Coder-Next-NVFP4 представляет собой квантованную версию модели Qwen3-Coder-Next, авторегрессионной языковой модели, которая использует оптимизированную архитектуру Transformer с...
Квантованная версия MiniMaxAI/MiniMax-M2.1 NVFP4 для эффективного вывода на графических процессорах NVIDIA Blackwell. — Формат: NVFP4 с двухуровневым масштабированием...
Квантование NVFP4 | 25,68 ГБ (было 70+ ГБ) | Текст/видение/аудиовход | Текстовый/речевой вывод Это Qwen3-Omni-30B-A3B-Instruct — современная омнимодальная...
Квантованная NVFP4 текстовая сборка GGUF Qwen3.6-27B для llama.cpp на NVIDIA DGX Spark (GB10, SM121). Это основная модель кодирования...
Модель NVIDIA Qwen3-235B-A22B-Thinking-2507 NVFP4 представляет собой квантованную версию модели Qwen3-235B-A22B-Thinking-2507 от Alibaba, которая представляет собой авторегрессионную языковую модель,...
Qwen3.5-397B-A17B-NVFP4 — это квантованная NVFP4 версия Qwen/Qwen3.5-397B-A17B, модели языка видения «Смесь экспертов» с 397 параметрами, 17 B активных...
Квантованная версия Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled — модель, ориентированная на рассуждения, основанная на Claude 4.6 Opus. Квантование с использованием NVIDIA ModelOpt...
Квантование смешанной точности с совместной экспертной обрезкой. Подходит для MoE с параметром 228 B в 90 ГБ на...
> [!TIP] > Поддержите эту работу → · X · GitHub · Документ REAP · Cerebras Квантование REAP...