nekomata-7b-instruction-gguf
Модель представляет собой версию GGUF инструкции rinna/nekomata-7b. Его можно использовать с llama.cpp для облегчения вывода. Квантование этой модели...
Модель представляет собой версию GGUF инструкции rinna/nekomata-7b. Его можно использовать с llama.cpp для облегчения вывода. Квантование этой модели...
Это пример, в котором использовалась неправильная инициализация, что привело к ограничению производительности. Модальности:Генерация текста Задача: Генерация текста Автор:...
Это версия Qwen/Qwen-AgentWorld-35B-A3B без цензуры, созданная с помощью аблитерации (более подробную информацию об этом см. в разделе «Удалить-отказы-с-трансформерами»)....
Qwimi3.5-9B-Kimik2.6-Opus-Distill-GGUF содержит квантованные версии GGUF Qwimi3.5-9B-Kimik2.6-Opus-Distill, доработку unsloth/Qwen3.5-9B, ориентированную на рассуждения. Эта модель была обучена как контролируемая точная...
> Исследование CyberNeurova — cyberneurova.ai. > Многоосная аблитерация на модели чата МО с гибридным вниманием и режимом мышления....
Плотный магистральный канал Qwen3.6 27B + встроенная головка NextN-MTP, квантованная для вывода с помощью одного графического процессора. —...
Это было сделано из Q80, а не напрямую из fp16, из-за этого могла быть потеряна некоторая* точность. Это...
Квантование GGUF lordx64/Qwen3.6-35B-A3B-Kimi-K2.6-Reasoning-Distilled для использования с llama.cpp и LM Studio. Базовая модель представляет собой усовершенствованный вариант Qwen3.6-35B-A3B, доработанный...
Это MLX-релиз урезанной версии Qwen3.6-35B-A3B от Qwen. Применив конвейер абляции Heretic к текстовому стеку MoE, поведение базового отказа...
TQ34S` — это 3,5-битный весовой формат с преобразованием Уолша-Адамара с четырьмя шкалами по 8 на блок по 32...