daVinci-Dev: Промежуточное обучение разработке программного обеспечения с использованием агентов — Новости — Обзор — Ключевые результаты — Зоопарк моделей — Наборы данных — Конвейер — Быстрый старт — Обучение — Оценка — Лицензия — Цитирование — 2026-05: 🎉 daVinci-Dev был принят в качестве устного доклада на ICML 2026. — 2026-01: выпущен документ, код и набор данных daVinci-Dev! daVinci-Dev — это семейство больших языковых моделей, предназначенных для разработки агентного программного обеспечения. В этой работе представлено систематическое исследование промежуточного обучения агентов и представлены собственные данные агентов, чтобы уменьшить несоответствие распределения между статическими корпусами предварительного обучения и динамическими средами с богатой обратной связью, с которыми сталкиваются реальные агенты кода. В нашем обучении используются два взаимодополняющих типа траекторий (подробности в статье): — Контекстуально-родные траектории \(mathcal{D}^{text{ctx}}{text{py}}\) (производные от PR): сохраняют полный поток информации, объединяя обнаружение файлов/извлечение контекста вместе с последовательным редактированием. Это обеспечивает широкий охват и разнообразие. — Экологически безопасные траектории \(mathcal{D}^{text{env}}{text{pass}}\) (развертывания исполняемых файлов): собраны из реальных исполняемых репозиториев с подлинными результатами инструментов/тестов, фиксируя аутентичные циклы обратной связи. -…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: GAIR
Теги: qwen2, chat, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 8 | Загрузок: 16
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.