cyankiwi/NVIDIA-Nemotron-3-Super-120B-A12B-AWQ-4bit

> Используйте температуру = 1,0 и topp = 0,95 для всех задач и обслуживающих серверов** — как для рассуждений, вызова инструментов, так и для общего чата. Более подробную информацию о том, как развернуть и использовать модель, см. в кратком руководстве ниже! > Для запуска Nemotron 3 Super на одном B200 или DGX Spark см.: NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4. Крайний срок для данных после обучения — февраль 2026 года. Крайний срок для данных перед обучением — июнь 2025 года. NVIDIA Nemotron™ — это семейство открытых моделей с открытыми весами, данными обучения и рецептами, обеспечивающими высочайшую эффективность и точность для создания специализированных агентов ИИ. Nemotron-3-Super-120B-A12B-BF16 — это большая языковая модель (LLM), обученная NVIDIA и предназначенная для предоставления мощных агентских, логических и диалоговых возможностей. Он оптимизирован для совместной работы агентов и больших объемов рабочих нагрузок, таких как автоматизация ИТ-заявок. Как и другие модели этого семейства, он реагирует на запросы и задачи пользователя, сначала генерируя логическую цепочку, а затем заканчивая окончательным ответом. Возможности рассуждения модели можно настроить с помощью флага в шаблоне чата. В модели используется гибридная архитектура «Скрытой смеси экспертов» (LatentMoE),…

Модальности:
Генерация текста

Задача: Генерация текста
Автор: cyankiwi
Теги: nvidia, nemotron-3, latent-moe, mtp, en, fr, es, it
Лайков: 7 | Загрузок: 2,163

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

kyujinpy/KO-Platypus2-7B-ex

ZeroXClem/Qwen2.5-7B-CelestialHarmony-1M

NickyNicky/Mistral-7B-OpenOrca-oasst_top1_2023-08-25-v3

unsloth/Qwen2.5-7B