Метка: hybrid-attention

Генерация текста

cyberneurova/CyberNeurova-Qwen3.6-35B-A3B-abliterated

> Исследование CyberNeurova — cyberneurova.ai. > Многоосная аблитерация на модели чата МО с гибридным вниманием и режимом мышления....

Генерация текста

wangzhang/Qwen3.6-27B-abliterated-GGUF

Квантование GGUF для wangzhang/Qwen3.6-27B-удалено, Qwen3.6-27B с подавлением отказа на втором проходе (10/100 отказов, 15/15 жесткого соответствия, совокупный KL...

Генерация текста

jc-builds/Qwen3.5-9B-Q4_K_M-GGUF

> 4-битный квантованный GGUF Qwen/Qwen3.5-9B, оптимизированный для вывода iOS на устройстве через llama.cpp. Самая мощная модель, которую можно...

Генерация текста

Brooooooklyn/Qwen3.6-27B-UD-Q6_K_XL-mlx

6-битное базовое квантование смешанной точности Qwen/Qwen3.6-27B для Apple Silicon с использованием стратегии квантования Unsloth Dynamic через mlx-node. Проведено...

Генерация текста

Brooooooklyn/Qwen3.5-9B-unsloth-mlx

3/4/5/6-битное квантование смешанной точности Qwen/Qwen3.5-9B для Apple Silicon с использованием стратегии квантования Unsloth Dynamic через mlx-node. Декодирование привязано...

Генерация текста

guiferrarib/genesis-152m-instruct

🧬 Genesis-152M-Instruct Исследовательская модель малого языка с гибридным линейным вниманием Genesis-152M-Instruct — это экспериментальная модель малого языка, которая...

Генерация текста

Brooooooklyn/Qwen3.5-27B-unsloth-mlx

3/4/5/6-битное квантование смешанной точности Qwen/Qwen3.5-27B для Apple Silicon с использованием стратегии квантования Unsloth Dynamic через mlx-node. Декодирование привязано...