nvidia/NVIDIA-Nemotron-3-Nano-4B-FP8

NVIDIA-Nemotron-3-Nano-4B-FP8 представляет собой квантованную версию NVIDIA-Nemotron-3-Nano-4B-BF16 и представляет собой малую языковую модель (SLM), обученную с нуля NVIDIA и разработанную как унифицированную модель как для рассуждений, так и для задач, не связанных с рассуждениями. Он реагирует на запросы и задачи пользователя, сначала генерируя логическую цепочку, а затем заканчивая окончательным ответом. Возможностями рассуждения модели можно управлять с помощью системной подсказки. Если пользователь предпочитает, чтобы модель давала окончательный ответ без промежуточных следов рассуждений, ее можно настроить на это, хотя и с небольшим снижением точности для более сложных подсказок, требующих рассуждений. И наоборот, разрешение модели сначала генерировать следы рассуждений обычно приводит к более высокому качеству окончательных решений запросов и задач. Модель была сжата из NVIDIA-Nemotron-Nano-9B-v2 с использованием фреймворка Nemotron Elastic. Подробности о материнской модели NVIDIA-Nemotron-Nano-9B-v2 можно найти в (техническом отчете Nemotron-H). Модель использует гибридную архитектуру, состоящую в основном из слоев Mamba-2 и MLP в сочетании всего с четырьмя уровнями внимания. Поддерживаемые языки: Английский. Улучшено с помощью Qwen. Регулирующие условия: Использование этой модели…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: nvidia
Теги: nemotron_h, nvidia, conversational, custom_code, en, endpoints_compatible
Лайков: 22 | Загрузок: 14,267

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

NeverSleep/HornyEchidna-13b-v0.1

cerebras/MiniMax-M2.1-REAP-139B-A10B

audreyt/Taiwan-LLM-13B-v2.0-chat-GGUF

seedboxai/KafkaLM-8x7B-German-V0.1