Метка: vision-language-model

Генерация текста

YanweiLi/MGM-8x7B

Платформа поддерживает серию плотных моделей и моделей большого языка (LLM) MoE от 2B до 34B с одновременным пониманием,...

Генерация текста

YanweiLi/MGM-7B

Платформа поддерживает серию плотных моделей и моделей большого языка (LLM) MoE от 2B до 34B с одновременным пониманием,...

Генерация текста

YanweiLi/MGM-8x7B-HD

Платформа поддерживает серию плотных моделей и моделей большого языка (LLM) MoE от 2B до 34B с одновременным пониманием,...

Генерация текста

YanweiLi/MGM-34B

Платформа поддерживает серию плотных моделей и моделей большого языка (LLM) MoE от 2B до 34B с одновременным пониманием,...

Генерация текста

YanweiLi/llama-vid-7b-full-224-video-fps-1

LLaMA-VID расширяет возможности существующих платформ для поддержки часовых видео и расширяет их верхний предел с помощью дополнительного токена...

Генерация текста

YanweiLi/MGM-13B-HD

Платформа поддерживает серию плотных моделей и моделей большого языка (LLM) MoE от 2B до 34B с одновременным пониманием,...

Генерация текста

Vi-VLM/Vistral-V-7B

Мы разработали и выпустили семейство Vista 7B, которое включает в себя как предварительно обученный проектор, так и доработанную...

Генерация текста

IVGSZ/Flash-VStream-7b

Мы предложили Flash-VStream — модель видеоязыка, имитирующую механизм памяти человека. Наша модель способна обрабатывать чрезвычайно длинные видеопотоки в...

Генерация текста

YanweiLi/llama-vid-7b-full-224-long-video

LLaMA-VID расширяет возможности существующих платформ для поддержки часовых видео и расширяет их верхний предел с помощью дополнительного токена...

Генерация текста

YanweiLi/MGM-2B

Платформа поддерживает серию плотных моделей и моделей большого языка (LLM) MoE от 2B до 34B с одновременным пониманием,...