sshh12/Mistral-7B-LoRA-VisionCLIP-LLAVA

Это веса для версии mistralai/Mistral-7B-Instruct-v0.1, настроенной для мультимодальных приложений. CLIPVisionModality (использовать в тексте и предоставлять изображения, закодированные как 576 токенов)

Модальности:
Генерация текста Мультимодальность

Задача: Генерация текста
Автор: sshh12
Теги: mistral-lmm, finetuned, multimodal
Лайков: 10 | Загрузок: 17

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

NeverSleep/Llama-3-Lumimaid-8B-v0.1

Llama3 тренировалась на наших наборах данных RP, мы старались обеспечить баланс между ERP и RP, не слишком возбужденно,...

Генерация текста

HuggingFaceM4/VLM_WebSight_finetuned

Эта модель преобразует скриншоты компонентов веб-сайта в коды HTML/CSS. Он основан на очень ранней контрольной точке нашей будущей...

Генерация текста

ckiplab/gpt2-base-chinese

Этот проект предоставляет традиционные китайские модели преобразователей (включая ALBERT, BERT, GPT2) и инструменты НЛП (включая сегментацию слов, маркировку...

Генерация текста

DavidAU/L3.1-RP-Hero-Dirty_Harry-8B-GGUF

ВНИМАНИЕ: НФВ. Яркая проза. ИНТЕНСИВНЫЙ. Интуитивные детали. Насилие. Графический УЖАС. ГОР. Ругаясь. БЕЗ ЦЕНЗУРЫ. Это модель LLama3.1 с...