Мы представляем Athene-V2-Chat-72B, LLM с открытым весом, который находится на одном уровне с GPT-4o во всех тестах. В настоящее время это лучшая открытая модель по версии Chatbot Arena, где она превосходит GPT-4o-0513 (лучшую модель GPT-4o на Arena) в сложных и математических категориях и находится на одном уровне с GPT-4o-0513 в кодировании, следовании инструкциям, более длинных запросах и многооборотности. Он обучается через RLHF с использованием Qwen-2.5-72B-Instruct в качестве базовой модели. Athene-V2-Chat-72B превосходно умеет общаться, считать и программировать. Его родственная модель, Athene-V2-Agent-72B, превосходит GPT-4o в сложных вызовах функций и агентских приложениях. — Разработано: командой Nexusflow — Тип модели: Модель чата — Доработана на основе модели: Qwen 2.5 72B-Instruct — Лицензия: Nexusflow Research License — Блог: https://nexusflow.ai/blogs/athene-v2 Athene-V2-Chat использует тот же шаблон чата, что и Qwen2.5-72B-Instruct. Ниже приведен пример простого использования библиотеки Transformers. Обратите внимание: добавив системную подсказку, которая побуждает модель думать шаг за шагом, модель может улучшить решение сложных математических запросов и задач, таких как подсчет rs в клубнике. По соображениям справедливости мы не включаем такое системное приглашение во время оценки чата. Мы хотели бы поблагодарить LMSYS…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: Nexusflow
Теги: qwen2, RLHF, Nexusflow, Athene, Chat Model, conversational, en, text-generation-inference
Лайков: 294 | Загрузок: 844
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.