Представляем новую модель LLM от Project Fluly. Цель этой модели — улучшить базовую модель путем ее обучения на различных наборах данных. Эта модель получается путем обучения и поэтапного слияния SFT и GRPO. Это специально доработанная версия для генерации качественного кода. — Разработано: @fluency — Тип модели: причинно-языковые модели (Qwen3ForCausalLM, LM Transformer) — Количество параметров: 4B — Количество параметров (без встраивания): 3,6B — Количество слоев: 36 — Количество головок внимания (GQA): 32 для Q и 8 для KV — Длина контекста: 32 768 изначально и 131 072 токены с YaRN — лицензия: Apache-2.0. Здесь представлен фрагмент кода с шаблоном applychat, показывающий, как загружать токенизатор и модель и как генерировать содержимое. Для локального использования такие приложения, как Ollama, LMStudio, MLX-LM, llama.cpp и KTransformers, также поддерживают Qwen3. > [!TIP] > Переключатель Enablethinking` также доступен в API, созданных SGLang и vLLM. По умолчанию у Qwen3 включены мыслительные способности, аналогично QwQ-32B. Это означает, что модель будет использовать свои способности к рассуждению для повышения качества генерируемых ответов. Например, если явно задать Enablethinking=True или…
Модальности:
Генерация текста
Области применения:
Генерация кода Диалог / чат
Задача: Генерация текста
Автор: fluently
Теги: qwen3, fluently, fluently-lm, coder, coding, trained, merged, sft
Лайков: 8 | Загрузок: 9
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.