QuantTrio/Qwen3-30B-A3B-Instruct-2507-GPTQ-Int8 - Каталог нейросетей
Генерация текста

QuantTrio/Qwen3-30B-A3B-Instruct-2507-GPTQ-Int8

Добавлено:
QuantTrio/Qwen3-30B-A3B-Instruct-2507-GPTQ-Int8

Мы представляем обновленную версию режима без мышления Qwen3-30B-A3B под названием Qwen3-30B-A3B-Instruct-2507, включающую следующие ключевые улучшения: — Значительные улучшения в общих возможностях, включая выполнение инструкций, логическое рассуждение, понимание текста, математику, естественные науки, кодирование и использование инструментов. — Существенный прогресс в охвате обширных знаний на нескольких языках. — Заметно лучшее соответствие предпочтениям пользователя при выполнении субъективных и открытых задач, что позволяет получать более полезные ответы и генерировать текст более высокого качества. — Расширенные возможности понимания длинного контекста 256K. Qwen3-30B-A3B-Instruct-2507 имеет следующие функции: — Тип: причинно-языковые модели — Этап обучения: предварительное обучение и постобучение — Количество параметров: всего 30,5B и активированных 3,3B — Количество параметров (без внедрения): 29,9B — Количество слоев: 48 — Количество головок внимания (GQA): 32 для Q и 4 для KV — Количество экспертов: 128 — Количество активированных экспертов: 8 — Длина контекста: 262 144 изначально. Более подробную информацию, включая оценку производительности, требования к оборудованию и производительность вывода, можно найти в нашем блоге, GitHub и документации. *: Для воспроизводимости…

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям


Задача: Генерация текста
Автор: QuantTrio
Теги: qwen3_moe, Qwen3, GPTQ, Int8, 量化修复, vLLM, conversational, endpoints_compatible
Лайков: 9  |  Загрузок: 666

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.