openbmb/RLAIF-V-7B

RLAIF-V-7B обучается на основе LLaVA 1.5 7B с использованием новой структуры RLAIF-V. Приспосабливаясь к человеческим предпочтениям посредством крупномасштабной обратной связи с искусственным интеллектом, модель достигает уровня надежности GPT-4V. RLAIF-V максимально использует обратную связь с открытым исходным кодом с двух ключевых точек зрения, включая высококачественные данные обратной связи и алгоритм онлайн-обучения с обратной связью. 📈 Самый надежный LLaVA 1.5: изучая отзывы искусственного интеллекта с открытым исходным кодом, в частности отзывы LLaVA-NeXT-34B, RLAIF-V-7B достигает наилучшего повышения надежности в LLaVA-v1.5 по сравнению с другими методами уменьшения галлюцинаций. 💪 Поддержание производительности скважины по общим характеристикам: По тестам, оценивающим общие возможности (например, MMStar), RLAIF-V-7B также демонстрирует хорошие характеристики. 🚀 Масштабирование времени вывода путем самостоятельного управления**. Использование RLAIF-V 7B в качестве модели вознаграждения может еще больше улучшить производительность модели в нескольких тестах с выбором лучшего из N. — Обучение на модели: llava-v1.5-7B — Обучение на данных: RLAIF-V-Dataset. Если наша модель/код/документ оказались для вас полезными, рассмотрите возможность процитировать наши статьи 📝:

Модальности:
Генерация текста

Задача: Генерация текста
Автор: openbmb
Теги: llava_llama, en, endpoints_compatible
Лайков: 12 | Загрузок: 38

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

TheBloke/koala-7B-GPTQ

abacusai/Giraffe-v2-70b-32k

anakin87/yo-Llama-3-8B-Instruct

mymaia/Magiq-Core-4