Эта модель представляет собой доработанную версию Qwen/Qwen3-30B-A3B в наборе данных burtenshaw/tulu-3-sft-personas-code-no-prompt. Он был обучен с использованием TRL. — TRL: 0.17.0 — Трансформеры: 4.51.3 — Pytorch: 2.7.0 — Наборы данных: 3.5.1 — Токенизаторы: 0.21.1
Модальности:
Генерация текста
Области применения:
Диалог / чат Генерация кода
Языки программирования:
Python
Задача: Генерация текста
Автор: burtenshaw
Теги: qwen3_moe, generated_from_trainer, trl, sft, conversational, endpoints_compatible
Лайков: 15 | Загрузок: 53
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.