Это MLX-релиз урезанной версии Qwen3.6-35B-A3B от Qwen. Применив конвейер абляции Heretic к текстовому стеку MoE, поведение базового отказа было удалено на уровне веса. В этом выпуске профиль рассуждений и следования инструкциям Qwen3.6-35B-A3B сохраняется в формате Apple MLX для локального развертывания на оборудовании Apple Silicon. Этот репозиторий MLX включает сохраненные файлы процессора изображений/видео Qwen3.6 и тензоры Vision Tower для сред выполнения с поддержкой мультимодального MLX Qwen3.6. Qwen3.6-35B-A3B — редкая модель MoE в семействе qwen35moe. Принятая удаленная контрольная точка источника BF16 была создана с использованием рабочего процесса передачи братьев и сестер в стиле Heretic MPOA/SOMA и завершена вмешательством разделенного MoE на стороне ввода, которое очистило официальный набор маркеров отказа из 25 подсказок до 1/25. Этот выпуск MLX был создан непосредственно на основе опубликованной контрольной точки BF16 Heretic с использованием высококачественной политики квантования с учетом слоев вместо плоского прохода по весу. — цель квантования: 8-битная — сборка квантования: 8-битное настроенное квантование с учетом слоев — контрольная точка источника: Youssofal/Qwen3.6-35B-A3B-Abliterated-Heretic-BF16 — опубликованный вариант: Qwen3.6-35B-A3B-Abliterated-Heretic-MLX-8bit The…
Модальности:
Генерация текста Компьютерное зрение Мультимодальность
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: Youssofal
Теги: mlx, qwen3_5_moe, mlx-lm, qwen, qwen3.6, moe, mixture-of-experts, multimodal
Лайков: 7 | Загрузок: 1,066
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.