MiniMax-M2.7-JANG_2L-CRACK
> Важно: эта модель использует формат квантования JANG — эквивалент GGUF для MLX в Apple Silicon. В настоящее...
> Важно: эта модель использует формат квантования JANG — эквивалент GGUF для MLX в Apple Silicon. В настоящее...
Хорошо настроенный Gemma 4 26B-A4B-it для генерации кода, отладки и проверки кода. Фрэнк — это усовершенствованная версия Gemma...
Marco-Mini-Base — это компактная, очень редкая многоязычная языковая модель Mixture-of-Experts (MoE) из семейства Marco-MoE, разработанная Alibaba International Digital...
Точная настройка Qwen3.5-35B-A3B, ориентированная на кодирование, с использованием SFT + GRPO на смеси реальных траекторий агента кодирования из...
> Бета-версия — это бета-версия. Ожидается версия 2 с большим количеством обучающих данных и улучшенной методологией обучения. На...
взвешенные/иматричные кванты https://huggingface.co/piotreknow02/GPT-OSS-Cybersecurity-20B-Merged-heretic. Для удобного обзора и списка загрузки посетите нашу страницу модели для этой модели. статические кванты...
Удаленная версия Qwen/Qwen3.5-122B-A10B с удаленным направлением отказа. — Метод: удаление проекции направления отказа (Arditi et al., 2024) —...
> [!ВНИМАНИЕ] > ⚠️ Внимание: эта модель может создавать повествования и ролевые игры, содержащие жестокий и графический эротический...
LFM2-MoE — это модель «Смесь экспертов» с 24 миллиардами общих параметров и ~ 2 миллиардами активных параметров на...
Этот репозиторий содержит удаленную версию модели Step-3.5-Flash от StepFun и версию FP16. Step-3.5-Flash — это массивная модель разреженной...