z-lab/Qwen3.6-35B-A3B-DFlash

Эта модель проекта все еще находится на стадии обучения (2000 шагов). Не стесняйтесь опробовать его и оставить отзыв, который будет очень полезен для нас в дальнейшем улучшении этой черновой модели DFlash. DFlash — это спекулятивный метод декодирования, который использует облегченную модель диффузии блоков для параллельного создания нескольких токенов. Это модель чертежника, которую необходимо использовать в паре с Qwen/Qwen3.6-35B-A3B. > Совет: Для длинных контекстных или агентских рабочих нагрузок добавьте —speculative-dflash-draft-window-size WINDOWSIZE`, чтобы включить внимание разработчика к скользящему окну. — Мышление: включено — Максимальное количество новых токенов: 4096 — Размер блока: 16 — Результаты SGLang. Результаты vLLM могут быть разными. Особая благодарность Дэвиду Вангу за его выдающуюся инженерную поддержку этого проекта. Мы также благодарны Modal, InnoMatrix и Yotta Labs за предоставление вычислительных ресурсов, использованных для обучения этого проекта модели. Если вы считаете DFlash полезным, процитируйте нашу работу. Чтобы поделиться отзывом о DFlash или запросить поддержку новой модели, заполните эту форму: DFlash Feedback.

Модальности:
Генерация текста

Задача: Генерация текста
Автор: z-lab
Теги: qwen3, feature-extraction, dflash, speculative-decoding, block-diffusion, draft-model, efficiency, qwen
Лайков: 23 | Загрузок: 2,156

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

DataPilot/ArrowCanaria-Llama-8B-RL-v0.1

ArrowCanaria-Llama-8B-RL-v0.1 は、ArrowCanaria-Llama-8B-SFT-v0.1 に対して RLHF（Обучение с подкреплением у человека Обратная связь) SFTモデルは高品質なデータで学習されていますが、モデルの応答が「データに含まれる平Награда Модель)品質や知識応答の正確性・分かりやすさを、SFTの水準からさらに引き上げています。強化学習アルゴリズムには GRPO (Оптимизация относительной политики группы)を採用し、DAPO損失関数による安定した最適化を実現しています。相談応答と知識応答の2フェーズで段階的にRLHFを行うことで、SFTで獲得した雑談・RP・キャラクター対話能力を保持しつつ、応答の質を選択的に向上させています。 —...

Генерация текста

Похожие модели (Генерация текста)

DataPilot/ArrowCanaria-Llama-8B-RL-v0.1

m-a-p/MuPT-v0-8192-1.97B

unsloth/Meta-Llama-3.1-70B-bnb-4bit

TheBloke/CAMEL-13B-Role-Playing-Data-GPTQ