yunconglong/MoE_13B_DPO

Тренажер DPO с набором данных Intel/orcadpopairs для улучшения [yunconglong/TruthfulDPOtomGrcFusionNet7Bx2MoE_13B]

Модальности:
Генерация текста

Задача: Генерация текста
Автор: yunconglong
Теги: mixtral, moe, DPO, RL-TUNED, text-generation-inference, endpoints_compatible
Лайков: 6 | Загрузок: 7,975

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

stelterlab/NVIDIA-Nemotron-3-Nano-30B-A3B-AWQ

Квантование AWQ: выполнено stelterlab в INT4 GEMM с использованием llm-compressor (https://github.com/vllm-project/llm-compressor — v0.9.0.1) из vllm-проекта. См. рецепт.yaml. Провел...

Генерация текста

LiquidAI/LFM2.5-1.2B-Base-GGUF

LFM2.5 — это новое семейство гибридных моделей, предназначенных для развертывания на устройстве. Он основан на архитектуре LFM2 с...

Генерация текста

uukuguy/speechless-code-mistral-7b-v1.0

Модель(и) AWQ для вывода графического процессора. Модели GPTQ для вывода графического процессора с несколькими вариантами параметров квантования. *...

Генерация текста

ibm-granite/granite-3.2-8b-instruct-preview

Краткое описание модели: Granite-3.2-8B-Instruct-Preview — это ранний выпуск модели с длинным контекстом 8B, настроенной для расширенных возможностей рассуждения...