heretic-org/Qwen3-4B-Thinking-2507-heretic

$ Для воспроизводимости мы сообщаем процент выигрышей, оцененный с помощью GPT-4.1. & Для очень сложных задач (включая PolyMATH и все задачи рассуждения и кодирования) мы используем выходную длину 81 920 токенов. Для всех остальных задач мы устанавливаем длину вывода 32 768. Код Qwen3 был в последних трансформерах Hugging Face, и мы советуем вам использовать последнюю версию трансформеров. Ниже приведен фрагмент кода, иллюстрирующий, как использовать модель для создания контента на основе заданных входных данных. Для развертывания вы можете использовать sglang>=0.4.6.post1 или vllm>=0.8.5 или создать конечную точку API, совместимую с OpenAI: — SGLang: для локального использования такие приложения, как Ollama, LMStudio, MLX-LM, llama.cpp и KTransformers, также поддерживают Qwen3. Qwen3 превосходно справляется с возможностями вызова инструментов. Мы рекомендуем использовать Qwen-Agent, чтобы максимально эффективно использовать агентские возможности Qwen3. Qwen-Agent внутренне инкапсулирует шаблоны вызова инструментов и анализаторы вызовов инструментов, что значительно снижает сложность кодирования. Чтобы определить доступные инструменты, вы можете использовать файл конфигурации MCP, использовать встроенный инструмент Qwen-Agent или интегрировать другие инструменты самостоятельно. Для достижения оптимальной производительности мы рекомендуем следующие настройки: 1.…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: heretic-org
Теги: qwen3, heretic, uncensored, decensored, abliterated, conversational, text-generation-inference, endpoints_compatible
Лайков: 11 | Загрузок: 25

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

nvidia/Llama2-70B-SteerLM-Chat

Undi95/dbrx-base

bartowski/DeepSeek-R1-ReDistill-Qwen-1.5B-v1.0-GGUF

zai-org/LongWriter-glm4-9b