Llama-3.3-Nemotron-Super-49B-GenRM-Multilingual — это генеративная модель вознаграждения, которая использует Llama-3.3-Nemotron-Super-49B-v1 в качестве основы и настраивается с помощью обучения с подкреплением для прогнозирования качества ответов, генерируемых LLM. Llama-3.3-Nemotron-Super-49B-GenRM-Multilingual можно использовать для оценки качества одного ответа или ранжирования между двумя ответами с учетом истории многоязычного разговора. Сначала он сгенерирует следы рассуждений, а затем выведет целочисленную оценку. Более высокий балл означает, что ответ более высокого качества. Подробности о том, как была обучена эта модель, см. на странице https://arxiv.org/abs/2505.11475. РЕГУЛИРУЮЩИЕ УСЛОВИЯ: Использование этой модели регулируется лицензией NVIDIA Open Model License. Дополнительная информация: Лицензионное соглашение сообщества Llama 3.3. Построен из Ламы. Llama-3.3-Nemotron-Super-49B-GenRM-Multilingual можно использовать для оценки качества одного ответа или ранжирования между двумя ответами с учетом истории многоязычного разговора. Сначала он сгенерирует следы рассуждений, а затем выведет целочисленную оценку. HuggingFace 27.06.2025 через https://huggingface.co/nvidia/Llama-3_3-Nemotron-Super-49B-GenRM-Multilingual HelpSteer3-Preference HelpSteer2-Preference SteerLM метод …
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: nvidia
Теги: nemotron-nas, nvidia, llama3.3, conversational, custom_code, en, zh, ko
Лайков: 7 | Загрузок: 55
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.