lmsys/vicuna-7b-v1.5-16k

Vicuna — это чат-помощник, обученный тонкой настройке Llama 2 на основе общих разговоров пользователей, собранных из ShareGPT. — Разработано: LMSYS — Тип модели: авторегрессионная языковая модель, основанная на архитектуре преобразователя — Лицензия: Лицензионное соглашение сообщества Llama 2 — Доработано на основе модели: Llama 2 — Репозиторий: https://github.com/lm-sys/FastChat — Блог: https://lmsys.org/blog/2023-03-30-vicuna/ — Документ: https://arxiv.org/abs/2306.05685 — Демо: https://chat.lmsys.org/ Основное использование Vicuna — исследования больших языковых моделей и чат-ботов. Основными предполагаемыми пользователями модели являются исследователи и любители обработки естественного языка, машинного обучения и искусственного интеллекта. — Интерфейс командной строки: https://github.com/lm-sys/FastChat#vicuna-weights — API-интерфейсы (OpenAI API, Huggingface API): https://github.com/lm-sys/FastChat/tree/main#api Vicuna v1.5 (16k) настроен на основе Llama 2 с контролируемой тонкой настройкой инструкций и линейным масштабированием RoPE. Данные обучения составляют около 125 тысяч разговоров, собранных с ShareGPT.com. Эти разговоры упакованы в последовательности, каждая из которых содержит 16 000 токенов. Подробности смотрите в разделе «Детали обучения моделей викуньи» в…

Модальности:
Генерация текста

Задача: Генерация текста
Автор: lmsys
Теги: llama, text-generation-inference
Лайков: 84 | Загрузок: 2,877

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

FredZhang7/anime-anything-promptgen-v2

Gen2B/HyGPT-10b-it

inferencerlabs/GLM-5-MLX-4.8bit

IlyaGusev/saiga2_7b_lora