nvidia/Llama-3_3-Nemotron-Super-49B-GenRM-Multilingual

Llama-3.3-Nemotron-Super-49B-GenRM-Multilingual — это генеративная модель вознаграждения, которая использует Llama-3.3-Nemotron-Super-49B-v1 в качестве основы и настраивается с помощью обучения с подкреплением для прогнозирования качества ответов, генерируемых LLM. Llama-3.3-Nemotron-Super-49B-GenRM-Multilingual можно использовать для оценки качества одного ответа или ранжирования между двумя ответами с учетом истории многоязычного разговора. Сначала он сгенерирует следы рассуждений, а затем выведет целочисленную оценку. Более высокий балл означает, что ответ более высокого качества. Подробности о том, как была обучена эта модель, см. на странице https://arxiv.org/abs/2505.11475. РЕГУЛИРУЮЩИЕ УСЛОВИЯ: Использование этой модели регулируется лицензией NVIDIA Open Model License. Дополнительная информация: Лицензионное соглашение сообщества Llama 3.3. Построен из Ламы. Llama-3.3-Nemotron-Super-49B-GenRM-Multilingual можно использовать для оценки качества одного ответа или ранжирования между двумя ответами с учетом истории многоязычного разговора. Сначала он сгенерирует следы рассуждений, а затем выведет целочисленную оценку. HuggingFace 27.06.2025 через https://huggingface.co/nvidia/Llama-3_3-Nemotron-Super-49B-GenRM-Multilingual HelpSteer3-Preference HelpSteer2-Preference SteerLM метод …

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: nvidia
Теги: nemotron-nas, nvidia, llama3.3, conversational, custom_code, en, zh, ko
Лайков: 7 | Загрузок: 55

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

yasserrmd/ConstructionSafetyQA-1.2B-V1

TheBloke/Mixtral-8x7B-v0.1-GPTQ

IAAR-Shanghai/xFinder-qwen1505

LiquidAI/LFM2-2.6B-Transcript