unsloth/Qwen3-4B-Instruct-2507 - Каталог нейросетей
Генерация текста

unsloth/Qwen3-4B-Instruct-2507

Добавлено:
unsloth/Qwen3-4B-Instruct-2507

Unsloth Dynamic 2.0 обеспечивает превосходную точность и превосходит другие ведущие методы количественного анализа. Мы представляем обновленную версию немыслящего режима Qwen3-4B под названием Qwen3-4B-Instruct-2507, включающую следующие ключевые улучшения: — Значительные улучшения в общих возможностях, включая выполнение инструкций, логическое рассуждение, понимание текста, математику, естественные науки, программирование и использование инструментов. — Существенный прогресс в охвате обширных знаний на нескольких языках. — Заметно лучшее соответствие предпочтениям пользователя при выполнении субъективных и открытых задач, что позволяет получать более полезные ответы и генерировать текст более высокого качества. — Расширенные возможности понимания длинного контекста 256K. Qwen3-4B-Instruct-2507 имеет следующие функции: — Тип: причинно-языковые модели — Этап обучения: предварительное обучение и постобучение — Количество параметров: 4.0B — Количество параметров (без внедрения): 3,6B — Количество слоев: 36 — Количество головок внимания (GQA): 32 для Q и 8 для KV — Длина контекста: 262 144 изначально. Более подробную информацию, включая оценку производительности, требования к оборудованию и производительность вывода, можно найти в нашем блоге, GitHub и документации. *: Для воспроизводимости сообщаем о выигрыше…

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям


Задача: Генерация текста
Автор: unsloth
Теги: qwen3, unsloth, conversational, text-generation-inference, endpoints_compatible
Лайков: 26  |  Загрузок: 67,037

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.