Метка: draft-model

Генерация текста

z-lab/Qwen3.5-397B-A17B-DFlash

Это совместный выпуск Z-Lab, Modal и SGLang. Черновая модель отображается в следующих репозиториях Hugging Face: — z-lab/Qwen3.5-397B-A17B-DFlash —...

Генерация текста

thoughtworks/MiniMax-M2.5-Eagle3

Легкая вытяжная головка EAGLE3 для MiniMax-M2.5 (229B MoE, ~10B активных параметров). Обучение проходило в SpecForge на 8 графических...

Генерация текста

abhinand/Qwen3.6-35B-A3B-DFlash-GGUF

> [!Note] > Этот репозиторий предоставляет конвертированные веса GGUF для использования с форком dflash llama.cpp, основанным на исходной...

Генерация текста

deepsweet/Qwen3.6-27B-DFlash-FP16

Эта модель была преобразована в FP16 из z-lab/Qwen3.6-27B-DFlash BF16. >DFlash — это новый метод спекулятивного декодирования, в котором...

Генерация текста

z-lab/Qwen3-Coder-Next-DFlash

DFlash — это спекулятивный метод декодирования, который использует облегченную модель диффузии блоков для параллельного создания нескольких токенов. Это...

Генерация текста

z-lab/Qwen3.6-35B-A3B-DFlash

Эта модель проекта все еще находится на стадии обучения (2000 шагов). Не стесняйтесь опробовать его и оставить отзыв,...

Генерация текста

z-lab/Qwen3.5-9B-DFlash

DFlash — это спекулятивный метод декодирования, который использует облегченную модель диффузии блоков для параллельного создания нескольких токенов, обеспечивая...

Генерация текста

z-lab/Qwen3.5-35B-A3B-DFlash

DFlash — это спекулятивный метод декодирования, который использует облегченную модель диффузии блоков для параллельного создания нескольких токенов, обеспечивая...