Emperorizzis/ASTRA-32B-Thinking-v1 - Каталог нейросетей
Генерация текста

Emperorizzis/ASTRA-32B-Thinking-v1

Добавлено:
Emperorizzis/ASTRA-32B-Thinking-v1

Модель ASTRA-32B-Thinking-v1 создана на основе Qwen3-32B и специально оптимизирована для многоэтапных задач, дополненных инструментами, с расширенными агентными возможностями в использовании сложных инструментов и структурированных рассуждений. Модель была представлена ​​в статье ASTRA: Автоматизированный синтез агентных траекторий и арен подкрепления. ASTRA-Thinking-32B достигает самых современных характеристик на многооборотном подмножестве BFCL-V3 при сопоставимых масштабах моделей. Данные обучения основаны на двух основных принципах автоматизации: — Ключевая особенность: мы создали обширный пул инструментов из 1585 серверов MCP, охватывающий 19 036 инструментов в 41 области. Конвейер данных анализирует зависимости на уровне схемы для создания исполняемых цепочек инструментов, гарантируя, что синтезированные траектории являются реалистичными и выполнимыми по параметрам. — Пример данных: ASTRA-SFT-1k. — Ключевая особенность: для поддержки надежного обучения с подкреплением мы синтезируем полностью проверяемые среды, реализованные на Python. Эти среды проверяются посредством изолированного выполнения, предоставляя многоходовые, пошагово проверяемые обучающие сигналы для обучения с подкреплением. Модель обучается в два последовательных этапа для улучшения принятия сложных агентских решений: 1. Контролируемый…

Модальности:
Генерация текста

Области применения:
Диалог / чат


Задача: Генерация текста
Автор: Emperorizzis
Теги: qwen3, conversational, text-generation-inference, endpoints_compatible
Лайков: 7  |  Загрузок: 7

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.