Nanbeige/ToolMind-Web-3B - Каталог нейросетей
Генерация текста

Nanbeige/ToolMind-Web-3B

Добавлено:
Nanbeige/ToolMind-Web-3B

ToolMind-Web-3B — это специализированный облегченный агент, созданный на основе базовой модели Nanbeige4-3B-Thinking-2511. После обширной SFT (контролируемая точная настройка) и RL (обучение с подкреплением), ориентированных на поведение поиска, наша модель достигает лидирующей производительности среди мелкомасштабных моделей в нескольких долгосрочных таблицах лидеров, таких как Xbench-Deepsearch, HLE и GAIA, обеспечивая надежное выполнение до сотен последовательных вызовов инструментов. ToolMind-Web-3B обеспечивает высококачественные долгосрочные рассуждения и расширенные инструменты поиска, сохраняя при этом небольшой объем параметров 3B. Несмотря на свои компактные размеры, он обеспечивает конкурентоспособную производительность во многих тестах, таких как Xbench-Deepsearch, GAIA и HLE. Модель оценивается в рамках рабочего процесса MiroThinkers, что обеспечивает стандартизированную и воспроизводимую оценку. 2. Комплексный набор данных для обеспечения качества с открытым исходным кодом, синтезированный на основе графов знаний «сущность-связь» Википедии. Мы предоставляем богатый структурированный набор данных для обеспечения качества, полученный на основе графов знаний Википедии, предназначенный для поддержки контролируемой точной настройки и обучения с подкреплением агентов, дополненных поиском. На этапе контролируемой точной настройки (SFT) судья на уровне хода определяет, какие…

Модальности:
Генерация текста

Области применения:
Диалог / чат RAG (поиск + генерация)


Задача: Генерация текста
Автор: Nanbeige
Теги: llama, search-agent, rag, deep-research, 3b, nlp, conversational, en
Лайков: 24  |  Загрузок: 2,485

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.