NVIDIA-Nemotron-Nano-12B-v2 — это большая языковая модель (LLM), обученная NVIDIA с нуля и разработанная как унифицированная модель как для рассуждений, так и для задач, не связанных с рассуждениями. Он реагирует на запросы и задачи пользователя, сначала генерируя логическую цепочку, а затем заканчивая окончательным ответом. Возможностями рассуждения модели можно управлять с помощью системной подсказки. Если пользователь предпочитает, чтобы модель давала окончательный ответ без промежуточных следов рассуждений, ее можно настроить на это, хотя и с небольшим снижением точности для более сложных подсказок, требующих рассуждений. И наоборот, разрешение модели сначала генерировать следы рассуждений обычно приводит к более высокому качеству окончательных решений запросов и задач. Модель была доработана из NVIDIA-Nemotron-Nano-12B-v2-Base и далее сжата в NVIDIA-Nemotron-Nano-9B-v2. Модель использует гибридную архитектуру, состоящую в основном из слоев Mamba-2 и MLP в сочетании всего с шестью уровнями внимания. Информацию об архитектуре можно найти в техническом отчете Nemotron-H. Модель обучалась с помощью Megatron-LM и NeMo-RL. Поддерживаемые языки: английский, немецкий, испанский, французский, итальянский и японский. Улучшено с помощью Qwen. Мы хотим…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: nvidia
Теги: nvidia, conversational, en, es, fr, de, it, ja
Лайков: 155 | Загрузок: 23,701
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.