nvidia/Nemotron-Research-Reasoning-Qwen-1.5B

Nemotron-Research-Reasoning-Qwen-1.5B 🚀 Ведущая универсальная модель рассуждения для передовых исследований и разработок 🌟 !Сравнение DeepSeek-R1-1.5B и Nemotron-Research-Reasoning-Qwen-1.5B — [20.11.2025] Выпущен Nemotron-Research-Reasoning-Qwen-1.5B-BroRL. — [2025-08-11] Опубликована запись в блоге ProRL V2: ProRL V2 — длительное обучение подтверждает законы масштабирования RL. — [2025-07-23] Выпущен Nemotron-Research-Reasoning-Qwen-1.5B-v2. — [2025-05-29] Выпущен Nemotron-Research-Reasoning-Qwen-1.5B. Nemotron-Research-Reasoning-Qwen-1.5B — это ведущая в мире модель с открытым весом 1,5B для сложных логических задач, таких как математические задачи, задачи кодирования, научные вопросы и логические головоломки. Он обучается с использованием алгоритма ProRL на разнообразном и всеобъемлющем наборе наборов данных. Наша модель достигла впечатляющих результатов, значительно превзойдя модель Deepseek 1.5B в широком спектре задач, включая математику, кодирование и GPQA. ProRL предназначен для продления периодов обучения RL, которые способствуют более глубокому изучению стратегий рассуждения. Он позволяет выполнять более 2000 этапов обучения и масштабировать данные обучения для выполнения различных задач — от традиционной математики до написания кода…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: nvidia
Теги: qwen2, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 238 | Загрузок: 3,491

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

unsloth/Qwen3-Coder-480B-A35B-Instruct-FP8

ChaoticNeutrals/Layris_9B

zementalist/llama-3-8B-chat-psychotherapist

kfkas/Llama-2-ko-7b-Chat