unsloth/Llama-3_3-Nemotron-Super-49B-v1-GGUF

Unsloth Dynamic 2.0 обеспечивает превосходную точность и превосходит другие ведущие методы количественного анализа. Llama-3.3-Nemotron-Super-49B-v1 — это модель большого языка (LLM), которая является производной от Meta Llama-3.3-70B-Instruct (также известной как эталонная модель). Это модель рассуждения, которая после обучения учитывает рассуждения, предпочтения человеческого чата и задачи, такие как RAG и вызов инструментов. Модель поддерживает длину контекста в 128 тыс. токенов. Llama-3.3-Nemotron-Super-49B-v1 — это модель, предлагающая отличный компромисс между точностью и эффективностью модели. Эффективность (пропускная способность) напрямую приводит к экономии. Используя новый подход поиска по нейронной архитектуре (NAS), мы значительно сокращаем объем памяти модели, позволяя выполнять более крупные рабочие нагрузки, а также помещая модель на один графический процессор при высоких рабочих нагрузках (H200). Этот подход NAS позволяет выбрать желаемую точку в компромиссе между точностью и эффективностью. Дополнительную информацию о подходе NAS можно найти в этой статье. Модель прошла многоэтапный процесс постобучения, чтобы улучшить ее способности к рассуждениям и нерассуждениям. Это включает в себя этап контролируемой тонкой настройки математики, кода, рассуждений и вызова инструментов, а также множественное обучение с подкреплением (RL)…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: unsloth
Теги: gguf, nemotron-nas, nvidia, unsloth — llama-3 — pytorch, custom_code, en, endpoints_compatible, imatrix
Лайков: 9 | Загрузок: 2,457

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Norod78/hebrew-gpt_neo-xl

mlabonne/Marcoro14-7B-slerp

01-ai/Yi-34B

LGAI-EXAONE/EXAONE-4.0-1.2B-GPTQ-Int8