Метка: moe - Страница 3 - Каталог нейросетей

Генерация текста

Youssofal/Qwen3.6-35B-A3B-Abliterated-Heretic-MLX-8bit

Это MLX-релиз урезанной версии Qwen3.6-35B-A3B от Qwen. Применив конвейер абляции Heretic к текстовому стеку MoE, поведение базового отказа...

Генерация текста

NinjaBoffin/MiniMax-M2.7-NVFP4

Квантование MiniMaxAI/MiniMax-M2.7 высокого качества NVFP4 для графических процессоров NVIDIA Blackwell. 5000 калибровочных образцов в 5 различных наборах данных....

Генерация текста

0xSero/GLM-5.1-555B-GGUF

> [!TIP] > Поддержите эту работу → · X · GitHub · Документ REAP · Cerebras REAP Это...

Генерация текста

thoughtworks/MiniMax-M2.5-Eagle3

Легкая вытяжная головка EAGLE3 для MiniMax-M2.5 (229B MoE, ~10B активных параметров). Обучение проходило в SpecForge на 8 графических...

Генерация текста

caiovicentino1/Qwopus-MoE-35B-A3B-HLWQ-Q5

> [!ВАЖНО] > Уведомление об именовании (10 апреля 2026 г.). Метод «HLWQ», используемый в этой модели, переименовывается в...

Генерация текста

ATH-MaaS/Marco-Mini-Global-Base

Marco-Mini-Global-Base — это расширенный вариант Marco-Mini-Base, который масштабирует лингвистический охват с 29 до 64 языков. Это очень редкая...

Генерация текста

caiovicentino1/Nemotron-Cascade-2-30B-A3B-HLWQ-Q5

Гибридная модель 30B Mamba + MoE с 7,6 ГБ видеопамяти, 15 ток/с, правильный вывод на RTX 4090. Самый...

Генерация текста

DJLougen/hermes-qwen3.5-35b-a3b-GGUF

— Q80 (36,9 ГБ): Наиболее близок к полной точности. Используйте, если у вас есть VRAM/RAM. — Q6K/Q5KM (28,5/24,7...

Генерация текста

empero-ai/openNemo-Cascade-2-30B-A3B

Замена Pure-PyTorch для NVIDIA Nemotron-Cascade-2-30B-A3B. Удаляет все внешние зависимости ядра CUDA (mamba-ssm, causal-conv1d) и заменяет их собственными операциями...

Генерация текста

wangzhang/Qwen3.5-122B-A10B-abliterated-GGUF

Квантовые версии GGUF wangzhang/Qwen3.5-122B-A10B-аблитерированные, Qwen/Qwen3.5-122B-A10B без цензуры, созданные с использованием Abliterix. — Снижение количества отказов на 95 %:...