Homunculus — это модель инструкций с 12 миллиардами параметров, переработанная из Qwen3-235B в магистраль Mistral-Nemo. Он был специально создан, чтобы сохранить двухрежимный стиль взаимодействия Qwen — /think (намеренная цепочка мыслей) и /nothink (краткие ответы) — при работе на одном потребительском графическом процессоре. —————————— | —————————————————————————————————————————————————- | Исследования в области дистилляции рассуждений, логит-имитации и помощников с переключением режимов. Облегченные производственные развертывания, требующие веских аргументов в мае, унаследуют предвзятость от преподавателя Qwen3 и данных предварительного обучения в масштабе Интернета. Использование длинного контекста (>32 тыс. токенов) является экспериментальным — ожидайте задержки и дополнительных затрат памяти.
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: arcee-ai
Теги: mistral, distillation, /think, /nothink, reasoning-transfer, arcee-ai, conversational, en
Лайков: 99 | Загрузок: 11
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.