Мы представляем обновленную версию немыслящего режима Qwen3-4B-FP8 под названием Qwen3-4B-Instruct-2507-FP8, включающую следующие ключевые улучшения: — Значительные улучшения в общих возможностях, включая выполнение инструкций, логическое рассуждение, понимание текста, математику, естественные науки, программирование и использование инструментов. — Существенный прогресс в охвате обширных знаний на нескольких языках. — Заметно лучшее соответствие предпочтениям пользователя при выполнении субъективных и открытых задач, что позволяет получать более полезные ответы и генерировать текст более высокого качества. — Расширенные возможности понимания длинного контекста 256K. Этот репозиторий содержит версию Qwen3-4B-Instruct-2507 для FP8, которая имеет следующие функции: — Тип: причинно-следственные языковые модели — Этап обучения: предварительное обучение и постобучение — Количество параметров: 4.0B — Количество параметров (без внедрения): 3,6B — Количество слоев: 36 — Количество головок внимания (GQA): 32 для Q и 8 для KV — Контекст Длина: 262 144 исходно. Более подробную информацию, включая оценку производительности, требования к оборудованию и производительность вывода, можно найти в нашем блоге, GitHub и документации. *: Для воспроизводимости мы сообщаем процент побед, оцененный по GPT-4.1. …
Модальности:
Генерация текста
Области применения:
Диалог / чат Следование инструкциям
Задача: Генерация текста
Автор: Qwen
Теги: qwen3, conversational, text-generation-inference, endpoints_compatible, fp8
Лайков: 72 | Загрузок: 741,773
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.