NVIDIA-Nemotron-Labs-3-Elastic-12B-A2B
Это версия 12B-A2B NVIDIA-Nemotron-Labs-3-Elastic-30B-A3B-BF16 с использованием сценария извлечения Nvidia. Это модель мышления/рассуждения; его мыслительный блок/следы очень короткие. Почти...
Это версия 12B-A2B NVIDIA-Nemotron-Labs-3-Elastic-30B-A3B-BF16 с использованием сценария извлечения Nvidia. Это модель мышления/рассуждения; его мыслительный блок/следы очень короткие. Почти...
Гибридная модель 30B Mamba + MoE с 7,6 ГБ видеопамяти, 15 ток/с, правильный вывод на RTX 4090. Самый...
Замена Pure-PyTorch для NVIDIA Nemotron-Cascade-2-30B-A3B. Удаляет все внешние зависимости ядра CUDA (mamba-ssm, causal-conv1d) и заменяет их собственными операциями...
> [!TIP] > Поддержите эту работу → · X · GitHub · Документ REAP · Cerebras REAP Этот...
См. NVIDIA-Nemotron-3-Super-120B-A12B MLX в действии – демонстрационное видео – Одиночный вывод ~49,6 токенов/с при 1000 токенов – Пакетный...
Эта модель mlx-community/Nemotron-Cascade-2-30B-A3B-8bit была преобразована в формат MLX из nvidia/Nemotron-Cascade-2-30B-A3B с использованием mlx-lm версии 0.31.2. Модальности:Генерация текста Области...
Модель генерации текста Модальности:Генерация текста Области применения:Диалог / чат Задача: Генерация текста Автор: mlx-community Теги: mlx, nemotron_h, nvidia,...
Крайняя дата для данных после обучения — 28 ноября 2025 года. Крайняя дата для данных перед обучением —...
> [!NOTE] > Включает исправления шаблона чата Unsloth! Для llama.cpp используйте —jinja > Unsloth Dynamic 2.0 обеспечивает превосходную...
NVIDIA-Nemotron-Nano-9B-v2-FP8 представляет собой квантованную версию NVIDIA-Nemotron-Nano-9B-v2 и представляет собой большую языковую модель (LLM), обученную с нуля NVIDIA и...