ВАЖНО: nanoLLaVA-1.5 вышла с гораздо лучшей производительностью. Пожалуйста, найдите это здесь. nanoLLaVA — это «маленькая, но мощная» модель языка видения 1B, предназначенная для эффективной работы на периферийных устройствах. — Базовый LLM: Quyen-SE-v0.1 (Qwen1.5-0.5B) — Vision Encoder: google/siglip-so400m-patch14-384. Данные обучения будут опубликованы позже, поскольку я все еще пишу об этом статью. Ожидайте, что финальный финал будет намного мощнее нынешнего. Модель соответствует стандарту ChatML, однако без n в конце `: ————————————|———————————————————————————————————-|
Модальности:
Генерация текста Мультимодальность
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: qnguyen3
Теги: llava-qwen2, llava, multimodal, qwen, conversational, custom_code, en
Лайков: 155 | Загрузок: 11,558
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.