Модель NVIDIA Qwen3-235B-A22B-Thinking-2507 NVFP4 представляет собой квантованную версию модели Qwen3-235B-A22B-Thinking-2507 от Alibaba, которая представляет собой авторегрессионную языковую модель, использующую оптимизированную архитектуру преобразователя. Для получения дополнительной информации, пожалуйста, проверьте здесь. Модель NVIDIA Qwen3-235B-A22B-Thinking-2507 NVFP4 квантуется с помощью оптимизатора модели TensorRT. Эта модель не принадлежит и не разработана NVIDIA. Эта модель была разработана и построена в соответствии с требованиями третьей стороны для этого приложения и варианта использования; см. ссылку на карту модели, отличной от NVIDIA (Qwen3-235B-A22B-Thinking-2507). Разработчики, желающие использовать готовые предварительно квантованные модели для развертывания в системах AI Agent, чат-ботах, системах RAG и других приложениях на базе AI. Huggingface 30.01.2026 через https://huggingface.co/nvidia/Qwen3-235B-A22B-Thinking-2507-NVFP4 Тип архитектуры: Трансформаторы Сетевая архитектура: Qwen3MoeForCausalLM Эта модель разработана на основе Qwen3-235B-A22B-Thinking-2507. Количество параметров модели: не разглашается. Тип(ы) ввода: Текст Формат(ы) ввода: Строка Параметры ввода: 1D (одномерный): Последовательности Другие свойства, относящиеся к вводу: Длина контекста 262 144, изначально Тип(ы) вывода: Текст …
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: nvidia
Теги: Model Optimizer, qwen3_moe, nvidia, ModelOpt, Qwen3, quantized, NVFP4, nvfp4
Лайков: 8 | Загрузок: 22,773
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.