deepsweet/Qwen3.6-27B-DFlash-FP16

Эта модель была преобразована в FP16 из z-lab/Qwen3.6-27B-DFlash BF16. >DFlash — это новый метод спекулятивного декодирования, в котором для черчения используется облегченная модель диффузии блоков. Это обеспечивает эффективное, высококачественное параллельное черчение, расширяющее границы скорости вывода. «FP16» — это оптимизация M1/M2 Apple Silicon, которая приводит к очень заметному ускорению обработки. Подробности см. в разделе «Баланс Metal FP32 против BF16 против FP16» и jundot/omlx/pull/880.

Модальности:
Генерация текста

Задача: Генерация текста
Автор: deepsweet
Теги: qwen3, image-feature-extraction, dflash, speculative-decoding, draft-model, custom_code, text-generation-inference, endpoints_compatible
Лайков: 8 | Загрузок: 377

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

abacusai/Dracarys2-Llama-3.1-70B-Instruct

baidu/ERNIE-4.5-21B-A3B-Paddle

gghfez/gemma-3-4b-novision

ReadyArt/L3.3-The-Omega-Directive-70B-Unslop-v2.0