Qwen/Qwen3-4B-Instruct-2507-FP8 - Каталог нейросетей
Генерация текста

Qwen/Qwen3-4B-Instruct-2507-FP8

Добавлено:
Qwen/Qwen3-4B-Instruct-2507-FP8

Мы представляем обновленную версию немыслящего режима Qwen3-4B-FP8 под названием Qwen3-4B-Instruct-2507-FP8, включающую следующие ключевые улучшения: — Значительные улучшения в общих возможностях, включая выполнение инструкций, логическое рассуждение, понимание текста, математику, естественные науки, программирование и использование инструментов. — Существенный прогресс в охвате обширных знаний на нескольких языках. — Заметно лучшее соответствие предпочтениям пользователя при выполнении субъективных и открытых задач, что позволяет получать более полезные ответы и генерировать текст более высокого качества. — Расширенные возможности понимания длинного контекста 256K. Этот репозиторий содержит версию Qwen3-4B-Instruct-2507 для FP8, которая имеет следующие функции: — Тип: причинно-следственные языковые модели — Этап обучения: предварительное обучение и постобучение — Количество параметров: 4.0B — Количество параметров (без внедрения): 3,6B — Количество слоев: 36 — Количество головок внимания (GQA): 32 для Q и 8 для KV — Контекст Длина: 262 144 исходно. Более подробную информацию, включая оценку производительности, требования к оборудованию и производительность вывода, можно найти в нашем блоге, GitHub и документации. *: Для воспроизводимости мы сообщаем процент побед, оцененный по GPT-4.1. …

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям


Задача: Генерация текста
Автор: Qwen
Теги: qwen3, conversational, text-generation-inference, endpoints_compatible, fp8
Лайков: 72  |  Загрузок: 741,773

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.