CyberNeurova-Qwen3.6-35B-A3B-abliterated
> Исследование CyberNeurova — cyberneurova.ai. > Многоосная аблитерация на модели чата МО с гибридным вниманием и режимом мышления....
> Исследование CyberNeurova — cyberneurova.ai. > Многоосная аблитерация на модели чата МО с гибридным вниманием и режимом мышления....
Точная настройка «LFM2-8B-A1B» с помощью Unsloth с использованием пользовательских наборов данных, контекст 128 КБ с точностью до 16...
Это версия 12B-A2B NVIDIA-Nemotron-Labs-3-Elastic-30B-A3B-BF16 с использованием сценария извлечения Nvidia. Это модель мышления/рассуждения; его мыслительный блок/следы очень короткие. Почти...
> Примечание. ZAYA1-8B использует собственную разреженную архитектуру MoE (ZayaForCausalLM), которая еще не поддерживается llama.cpp. Файлы GGUF будут добавлены...
Это MLX-релиз урезанной версии Qwen3.6-35B-A3B от Qwen. Применив конвейер абляции Heretic к текстовому стеку MoE, поведение базового отказа...
Квантование MiniMaxAI/MiniMax-M2.7 высокого качества NVFP4 для графических процессоров NVIDIA Blackwell. 5000 калибровочных образцов в 5 различных наборах данных....
Легкая вытяжная головка EAGLE3 для MiniMax-M2.5 (229B MoE, ~10B активных параметров). Обучение проходило в SpecForge на 8 графических...
> [!ВАЖНО] > Уведомление об именовании (10 апреля 2026 г.). Метод «HLWQ», используемый в этой модели, переименовывается в...
Marco-Mini-Global-Base — это расширенный вариант Marco-Mini-Base, который масштабирует лингвистический охват с 29 до 64 языков. Это очень редкая...
Замена Pure-PyTorch для NVIDIA Nemotron-Cascade-2-30B-A3B. Удаляет все внешние зависимости ядра CUDA (mamba-ssm, causal-conv1d) и заменяет их собственными операциями...