Вдохновленный успехом нашего подхода II-Researcher, который применяет инструменты расширенного рассуждения поверх модели Deep-seek-R1, II-Search-4B-CIR представляет интегрированное в код рассуждение (CIR), более мощный и гибкий метод взаимодействия инструмента с процессом рассуждения. Мы указываем модели генерировать блоки кода, заключенные между n, внутри которых она может вызывать набор предопределенных функций. Эти функции действуют как интерфейсы к внешним ресурсам, подобно парадигме вызова инструментов, но обеспечивающие большую гибкость и контроль. Такой подход позволяет модели не только извлекать внешнюю информацию, но также обрабатывать, фильтровать и анализировать ее программно внутри самого кода. — websearch(query: str, numresult: int) — webvisit(url: str)` В наших ранних экспериментах мы обнаружили, что даже большие модели, такие как Qwen/Qwen3-235B-A22B или Deep-seek-R1, не могут эффективно создавать формат кода. Иногда модели вообще не используют какие-либо блоки кода, вместо этого полагаясь на свою внутреннюю базу знаний для ответа на запрос. Чтобы решить эту проблему, мы сначала собрали набор данных и выполнили точную настройку SFT для модели Qwen/Qwen3-4B. После этого мы дополнительно оптимизировали модель SFT…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: Intelligent-Internet
Теги: qwen3, conversational, text-generation-inference, endpoints_compatible
Лайков: 15 | Загрузок: 12
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.