Мы представляем обновленную версию немыслящего режима Qwen3-235B-A22B под названием Qwen3-235B-A22B-Instruct-2507, включающую следующие ключевые улучшения: — Значительные улучшения в общих возможностях, включая выполнение инструкций, логическое рассуждение, понимание текста, математику, естественные науки, кодирование и использование инструментов. — Существенный прогресс в охвате обширных знаний на нескольких языках. — Заметно лучшее соответствие предпочтениям пользователя при выполнении субъективных и открытых задач, что позволяет получать более полезные ответы и генерировать текст более высокого качества. — Расширенные возможности понимания длинного контекста 256K. Qwen3-235B-A22B-Instruct-2507 имеет следующие функции: — Тип: причинно-языковые модели — Этап обучения: предварительное обучение и постобучение — Количество параметров: всего 235B и 22B активированных — Количество параметров (без внедрения): 234B — Количество слоев: 94 — Количество головок внимания (GQA): 64 для Q и 4 для KV — Количество экспертов: 128 — Количество активированных экспертов: 8 — Длина контекста: 262 144 изначально. Более подробную информацию, включая оценку производительности, требования к оборудованию и производительность вывода, можно найти в нашем блоге, GitHub и документации. *: Для…
Модальности:
Генерация текста
Области применения:
Диалог / чат Следование инструкциям
Задача: Генерация текста
Автор: QuantTrio
Теги: qwen3_moe, Qwen3, AWQ, 量化修复, vLLM, conversational, endpoints_compatible, 4-bit
Лайков: 10 | Загрузок: 4,439
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.