Это веса для версии mistralai/Mistral-7B-Instruct-v0.1, настроенной для мультимодальных приложений. CLIPVisionModality (использовать в тексте и предоставлять изображения, закодированные как 576 токенов)
Модальности:
Генерация текста Мультимодальность
Задача: Генерация текста
Автор: sshh12
Теги: mistral-lmm, finetuned, multimodal
Лайков: 10 | Загрузок: 17
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.