TinyLLaVA: Структура мелкомасштабных больших мультимодальных моделей [2024.03.10] базовый рецепт готов! [2024.03.10] Тонкая настройка скриптов завершена! [2024.02.25] Обновлены оценочные скрипты и документация! [2024.02.25] Описания данных выведены. Выпустите TinyLLaVA-1.5B и TinyLLaVA-2.0B! [2024.02.24] Добавлен пример кода вывода и загрузки модели! [2024.02.23] Выпущен ознакомительный код и скрипты! [2024.02.21] Создание репозитория TinyLLaVABench на GitHub! [2024.02.21] Наша статья: TinyLLaVA: Структура мелкомасштабных больших мультимодальных моделей вышла! [2024.01.11]** Вышла наша первая модель TinyLLaVA-1.4B! — [ ] Добавлена поддержка Ollama и llama.cpp. — [x] Руководство для разработчиков / Как собрать демо-версию локально. — [x] Документы по обучению и настройке. — [x] Описания моделей зоопарков. — [x]Примеры и умозаключения. — [x] Выпуск кода для обучения. — [x] Добавить описания для оценки. — [x] Добавить описания для подготовки данных. — [x] Выпуск TinyLLaVA-1.5B и TinyLLaVA-2.0B. — [x] Выпуск TinyLLaVA-3.1B. — [x] Выпустите оценочный код и веса сегодня (2024.2.23). — Наша лучшая модель TinyLLaVA-3.1B обеспечивает более высокую общую производительность по сравнению с существующими моделями 7B, такими как LLaVA-1.5 и Qwen-VL. — Установить -…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: bczhou
Теги: tiny_llava_phi, llava, vision-language, llm, lmm, custom_code, en, zh
Лайков: 27 | Загрузок: 198
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.