Метка: nvfp4

Генерация текста

NinjaBoffin/MiniMax-M2.7-NVFP4

Квантование MiniMaxAI/MiniMax-M2.7 высокого качества NVFP4 для графических процессоров NVIDIA Blackwell. 5000 калибровочных образцов в 5 различных наборах данных....

Генерация текста

vincentzed-hf/Qwen3-Coder-Next-NVFP4

Модель NVIDIA Qwen3-Coder-Next-NVFP4 представляет собой квантованную версию модели Qwen3-Coder-Next, авторегрессионной языковой модели, которая использует оптимизированную архитектуру Transformer с...

Генерация текста

GadflyII/MiniMax-M2.1-NVFP4

Квантованная версия MiniMaxAI/MiniMax-M2.1 NVFP4 для эффективного вывода на графических процессорах NVIDIA Blackwell. — Формат: NVFP4 с двухуровневым масштабированием...

Генерация текста

cybermotaz/Qwen3-Omni-30B-A3B-Instruct-NVFP4

Квантование NVFP4 | 25,68 ГБ (было 70+ ГБ) | Текст/видение/аудиовход | Текстовый/речевой вывод Это Qwen3-Omni-30B-A3B-Instruct — современная омнимодальная...

Генерация текста

nilayparikh/Qwen3.6-27B-Text-NVFP4-MTP-GGUF

Квантованная NVFP4 текстовая сборка GGUF Qwen3.6-27B для llama.cpp на NVIDIA DGX Spark (GB10, SM121). Это основная модель кодирования...

Генерация текста

nvidia/Qwen3-235B-A22B-Thinking-2507-NVFP4

Модель NVIDIA Qwen3-235B-A22B-Thinking-2507 NVFP4 представляет собой квантованную версию модели Qwen3-235B-A22B-Thinking-2507 от Alibaba, которая представляет собой авторегрессионную языковую модель,...

Генерация текста

lukealonso/Qwen3.5-397B-A17B-NVFP4

Qwen3.5-397B-A17B-NVFP4 — это квантованная NVFP4 версия Qwen/Qwen3.5-397B-A17B, модели языка видения «Смесь экспертов» с 397 параметрами, 17 B активных...

Генерация текста

Alexzander85/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-NVFP4-MLP-FP8KV

Квантованная версия Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled — модель, ориентированная на рассуждения, основанная на Claude 4.6 Opus. Квантование с использованием NVIDIA ModelOpt...

Генерация текста

rdtand/MiniMax-M2.7-PrismaQuant-3.20bit-vllm

Квантование смешанной точности с совместной экспертной обрезкой. Подходит для MoE с параметром 228 B в 90 ГБ на...

Генерация текста

0xSero/GLM-5.1-478B-NVFP4

> [!TIP] > Поддержите эту работу → · X · GitHub · Документ REAP · Cerebras Квантование REAP...