Vicuna — это чат-помощник, обученный тонкой настройке Llama 2 на основе общих разговоров пользователей, собранных из ShareGPT. — Разработано: LMSYS — Тип модели: авторегрессионная языковая модель, основанная на архитектуре преобразователя — Лицензия: Лицензионное соглашение сообщества Llama 2 — Доработано на основе модели: Llama 2 — Репозиторий: https://github.com/lm-sys/FastChat — Блог: https://lmsys.org/blog/2023-03-30-vicuna/ — Документ: https://arxiv.org/abs/2306.05685 — Демо: https://chat.lmsys.org/ Основное использование Vicuna — исследования больших языковых моделей и чат-ботов. Основными предполагаемыми пользователями модели являются исследователи и любители обработки естественного языка, машинного обучения и искусственного интеллекта. — Интерфейс командной строки: https://github.com/lm-sys/FastChat#vicuna-weights — API-интерфейсы (OpenAI API, Huggingface API): https://github.com/lm-sys/FastChat/tree/main#api Vicuna v1.5 (16k) настроен на основе Llama 2 с контролируемой тонкой настройкой инструкций и линейным масштабированием RoPE. Данные обучения составляют около 125 тысяч разговоров, собранных с ShareGPT.com. Эти разговоры упакованы в последовательности, каждая из которых содержит 16 000 токенов. Подробности смотрите в разделе «Детали обучения моделей викуньи» в…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: lmsys
Теги: llama, text-generation-inference
Лайков: 84 | Загрузок: 2,877
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.