vincentzed-hf/Qwen3-Coder-Next-NVFP4 - Каталог нейросетей
Генерация текста

vincentzed-hf/Qwen3-Coder-Next-NVFP4

Добавлено:
vincentzed-hf/Qwen3-Coder-Next-NVFP4

Модель NVIDIA Qwen3-Coder-Next-NVFP4 представляет собой квантованную версию модели Qwen3-Coder-Next, авторегрессионной языковой модели, которая использует оптимизированную архитектуру Transformer с Mixture of Experts (MoE). Для получения дополнительной информации обратитесь к карточке модели Qwen3-Coder-Next. Модель NVIDIA Qwen3-Coder-Next-NVFP4 была квантована с помощью оптимизатора модели TensorRT. Эта модель не принадлежит и не разработана NVIDIA. Эта модель была разработана и построена в соответствии с требованиями третьей стороны для этого приложения и варианта использования; см. ссылку на карту модели, отличной от NVIDIA (Qwen3-Coder-Next). Разработчики, желающие взять с полки предварительно квантованные модели для развертывания в системах AI Agent, чат-ботах, системах RAG и других приложениях на базе AI. Huggingface через https://huggingface.co/nvidia/Qwen3-Coder-Next-NVFP4 Тип архитектуры: Трансформаторы (гибридная) Архитектура сети: Qwen3NextForCausalLM Подробности модели: Всего параметров: 80,1 млрд. Активных параметров: 3,1 млрд. (редкая смесь экспертов) Конфигурация экспертов: всего 512 экспертов, 10 активированных на каждый токен + 1 общий эксперт. Механизмы внимания: гибридная схема, сочетающая Gated DeltaNet (линейное внимание для эффективности в длинном контексте) и Gated Attention…

Модальности:
Генерация текста

Области применения:
Диалог / чат Генерация кода


Задача: Генерация текста
Автор: vincentzed-hf
Теги: Model Optimizer, qwen3_next, nvidia, ModelOpt, Qwen3CoderNext, quantized, NVFP4, nvfp4
Лайков: 7  |  Загрузок: 416

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.