Intelligent-Internet/II-Search-CIR-4B

Вдохновленный успехом нашего подхода II-Researcher, который применяет инструменты расширенного рассуждения поверх модели Deep-seek-R1, II-Search-4B-CIR представляет интегрированное в код рассуждение (CIR), более мощный и гибкий метод взаимодействия инструмента с процессом рассуждения. Мы указываем модели генерировать блоки кода, заключенные между n, внутри которых она может вызывать набор предопределенных функций. Эти функции действуют как интерфейсы к внешним ресурсам, подобно парадигме вызова инструментов, но обеспечивающие большую гибкость и контроль. Такой подход позволяет модели не только извлекать внешнюю информацию, но также обрабатывать, фильтровать и анализировать ее программно внутри самого кода. — websearch(query: str, numresult: int) — webvisit(url: str)` В наших ранних экспериментах мы обнаружили, что даже большие модели, такие как Qwen/Qwen3-235B-A22B или Deep-seek-R1, не могут эффективно создавать формат кода. Иногда модели вообще не используют какие-либо блоки кода, вместо этого полагаясь на свою внутреннюю базу знаний для ответа на запрос. Чтобы решить эту проблему, мы сначала собрали набор данных и выполнили точную настройку SFT для модели Qwen/Qwen3-4B. После этого мы дополнительно оптимизировали модель SFT…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: Intelligent-Internet
Теги: qwen3, conversational, text-generation-inference, endpoints_compatible
Лайков: 15 | Загрузок: 12

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

crestf411/gemma2-9B-sunfall-v0.5.2

bartowski/Replete-Coder-Qwen2-1.5b-GGUF

Qwen/Qwen2.5-7B-Instruct-GPTQ-Int4

TheBloke/Airoboros-c34B-2.1-GPTQ