Платформа поддерживает серию плотных моделей и моделей большого языка (LLM) MoE от 2B до 34B с одновременным пониманием, рассуждением и генерацией изображений HD. Вы также можете попробовать другие наши модели серии MGM: Настройка нормального разрешения: MGM-7B, MGM-13B, MGM-8x7B, MGM-34B Настройка высокого разрешения: MGM-7B-HD, MGM-13B, MGM-8x7B-HD, MGM-34B-HD Тип модели: MGM — это чат-бот с открытым исходным кодом, обученный посредством тонкой настройки Gemma на мультимодальных данных, генерируемых GPT и следующих инструкциям. Это расширяет возможности существующих платформ для одновременной поддержки понимания, рассуждения и создания изображений HD. Куда отправлять вопросы или комментарии о модели: https://github.com/dvlab-research/MGM/issues Основное предполагаемое использование: Основное использование — исследование крупных мультимодальных моделей и чат-ботов. Основные предполагаемые пользователи. Основными предполагаемыми пользователями модели являются исследователи и любители компьютерного зрения, обработки естественного языка, машинного обучения и искусственного интеллекта. Эта модель обучена на основе набора данных MGM-Instruction. Для получения более подробной информации посетите Github.
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: YanweiLi
Теги: vision-language model, gemma, generation, conversational, endpoints_compatible
Лайков: 21 | Загрузок: 29
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.