— Домашняя страница: в процессе — Репозиторий: https://github.com/prometheus-eval/prometheus-eval — Документ: https://arxiv.org/abs/2405.01535 — Контактное лицо: seungone@cmu.edu Prometheus 2 — это альтернатива оценке GPT-4 при выполнении детальной оценки базового LLM и модели вознаграждения за подкрепление обучения на основе отзывов пользователей. (РЛХФ). !plot Prometheus 2 — это языковая модель, использующая Mistral-Instruct в качестве базовой модели. Он настроен на 100 тысяч отзывов в коллекции отзывов и 200 тысяч отзывов в коллекции предпочтений. Он также производится путем объединения весов для поддержки как абсолютной оценки (прямая оценка), так и относительной оценки (парное ранжирование). Удивительно то, что мы обнаружили, что объединение весов также повышает производительность в каждом формате. — Тип модели: языковая модель — Язык(и) (NLP): английский — Лицензия: Apache 2.0 — Связанные модели: все контрольные точки Prometheus — Ресурсы для получения дополнительной информации: — Исследовательская работа — Репозиторий GitHub Prometheus обучается с использованием двух разных размеров (7B и 8x7B). Вы можете проверить LM размером 8x7B на этой странице. Кроме того, ознакомьтесь с нашим набором данных на этой странице и этой странице. Мы создали функции-оболочки и классы для удобного использования Prometheus…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: prometheus-eval
Теги: mistral, text2text-generation, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 101 | Загрузок: 77,868
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.