Qwen3-Coder-53B-A3B-Instruct-TOTAL-RECALL-v2-MASTER-CODER-L [контекст 256k] Этот репозиторий содержит исходный код полной точности в формате «безопасных тензоров» для генерации GGUF, GPTQ, EXL2, AWQ, HQQ и других форматов. Исходный код также можно использовать напрямую. Эта модель предназначена для КОДИРОВАНИЯ и программирования на всех основных языках программирования, а также на многих второстепенных. Эта модель основана на Qwen3-Coder-30B-A3B-Instruct (МЧС, 128 экспертов, 10 активировано) с Brainstorm 20X (от DavidAU) — подробности внизу этой страницы. Адаптер Brainstorm улучшит общую производительность и нестандартное мышление. Это создает модель из 53B параметров, 84 слоев и 1011 тензоров. Я изменил экспертов по умолчанию до 10 вместо базовых 8 (активированных) — обнаружил, что это лучше работает с программированием и мозговым штурмом в целом. Вы можете изменить количество активированных экспертов — см. ниже в разделе помощи. Я включил в эту модель дополнительную системную подсказку, вызывающую «мышление», если вы хотите ее активировать. Для кодирования, программирования установите эксперта на: — 6-8 для общей работы. — 10 за умеренную работу. [по умолчанию] — 12-16 для сложной работы, длинных проектов, сложного кодирования. — Предлагать минимальное контекстное окно от 4 до 8 тысяч. — А если говорить более подробно,…
Модальности:
Генерация текста
Области применения:
Генерация кода Программирование Диалог / чат Следование инструкциям
Задача: Генерация текста
Автор: DavidAU
Теги: qwen3_moe, programming, code generation, code, codeqwen, moe, coding, coder
Лайков: 14 | Загрузок: 15
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.