Qwen3.6-35B-A3B-Abliterated-Heretic-MLX-8bit
Это MLX-релиз урезанной версии Qwen3.6-35B-A3B от Qwen. Применив конвейер абляции Heretic к текстовому стеку MoE, поведение базового отказа...
Это MLX-релиз урезанной версии Qwen3.6-35B-A3B от Qwen. Применив конвейер абляции Heretic к текстовому стеку MoE, поведение базового отказа...
Квантование MiniMaxAI/MiniMax-M2.7 высокого качества NVFP4 для графических процессоров NVIDIA Blackwell. 5000 калибровочных образцов в 5 различных наборах данных....
> [!TIP] > Поддержите эту работу → · X · GitHub · Документ REAP · Cerebras REAP Это...
Легкая вытяжная головка EAGLE3 для MiniMax-M2.5 (229B MoE, ~10B активных параметров). Обучение проходило в SpecForge на 8 графических...
> [!ВАЖНО] > Уведомление об именовании (10 апреля 2026 г.). Метод «HLWQ», используемый в этой модели, переименовывается в...
Marco-Mini-Global-Base — это расширенный вариант Marco-Mini-Base, который масштабирует лингвистический охват с 29 до 64 языков. Это очень редкая...
Гибридная модель 30B Mamba + MoE с 7,6 ГБ видеопамяти, 15 ток/с, правильный вывод на RTX 4090. Самый...
— Q80 (36,9 ГБ): Наиболее близок к полной точности. Используйте, если у вас есть VRAM/RAM. — Q6K/Q5KM (28,5/24,7...
Замена Pure-PyTorch для NVIDIA Nemotron-Cascade-2-30B-A3B. Удаляет все внешние зависимости ядра CUDA (mamba-ssm, causal-conv1d) и заменяет их собственными операциями...
Квантовые версии GGUF wangzhang/Qwen3.5-122B-A10B-аблитерированные, Qwen/Qwen3.5-122B-A10B без цензуры, созданные с использованием Abliterix. — Снижение количества отказов на 95 %:...