unsloth/Llama-3_3-Nemotron-Super-49B-v1-GGUF - Каталог нейросетей
Генерация текста

unsloth/Llama-3_3-Nemotron-Super-49B-v1-GGUF

Добавлено:
unsloth/Llama-3_3-Nemotron-Super-49B-v1-GGUF

Unsloth Dynamic 2.0 обеспечивает превосходную точность и превосходит другие ведущие методы количественного анализа. Llama-3.3-Nemotron-Super-49B-v1 — это модель большого языка (LLM), которая является производной от Meta Llama-3.3-70B-Instruct (также известной как эталонная модель). Это модель рассуждения, которая после обучения учитывает рассуждения, предпочтения человеческого чата и задачи, такие как RAG и вызов инструментов. Модель поддерживает длину контекста в 128 тыс. токенов. Llama-3.3-Nemotron-Super-49B-v1 — это модель, предлагающая отличный компромисс между точностью и эффективностью модели. Эффективность (пропускная способность) напрямую приводит к экономии. Используя новый подход поиска по нейронной архитектуре (NAS), мы значительно сокращаем объем памяти модели, позволяя выполнять более крупные рабочие нагрузки, а также помещая модель на один графический процессор при высоких рабочих нагрузках (H200). Этот подход NAS позволяет выбрать желаемую точку в компромиссе между точностью и эффективностью. Дополнительную информацию о подходе NAS можно найти в этой статье. Модель прошла многоэтапный процесс постобучения, чтобы улучшить ее способности к рассуждениям и нерассуждениям. Это включает в себя этап контролируемой тонкой настройки математики, кода, рассуждений и вызова инструментов, а также множественное обучение с подкреплением (RL)…

Модальности:
Генерация текста

Области применения:
Диалог / чат


Задача: Генерация текста
Автор: unsloth
Теги: gguf, nemotron-nas, nvidia, unsloth — llama-3 — pytorch, custom_code, en, endpoints_compatible, imatrix
Лайков: 9  |  Загрузок: 2,457

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.