Модели больших действий (LAM) — это расширенные языковые модели, предназначенные для улучшения процесса принятия решений путем перевода намерений пользователя в исполняемые действия. Являясь мозгом агентов ИИ, LAM автономно планируют и выполняют задачи для достижения конкретных целей, что делает их неоценимыми для автоматизации рабочих процессов в различных областях. Данная версия модели предназначена только для исследовательских целей. Новая серия xLAM-2, основанная на наших самых передовых конвейерах синтеза, обработки и обучения данных, знаменует собой значительный скачок в многооборотном диалоге и использовании инструментов. Обучение проводилось с использованием нашей новой платформы APIGen-MT, которая генерирует высококачественные обучающие данные посредством моделирования взаимодействия агента и человека. Наши модели демонстрируют высочайшую производительность в тестах BFCL и τ-bench, превосходя по производительности передовые модели, такие как GPT-4o и Claude 3.5. Примечательно, что даже наши модели меньшего размера демонстрируют превосходные возможности в многооборотных сценариях, сохраняя при этом исключительную согласованность во всех испытаниях. Мы также усовершенствовали шаблон чата и интеграцию vLLM, упрощая создание продвинутых агентов ИИ. По сравнению с предыдущими моделями xLAM, xLAM-2 обеспечивает превосходную производительность и плавное развертывание между приложениями. Сравнительная производительность…
Модальности:
Генерация текста
Области применения:
Диалог / чат Вызов функций (Tool use)
Задача: Генерация текста
Автор: Salesforce
Теги: llama, function-calling, LLM Agent, tool-use, qwen, LLaMA-factory, conversational, en
Лайков: 51 | Загрузок: 355
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.