TinyLlama/TinyLlama-1.1B-Chat-v0.4

Целью проекта TinyLlama является предварительное обучение модели Llama размером 1,1 млрд на 3 триллионах токенов. При правильной оптимизации мы можем достичь этого «всего» за 90 дней, используя 16 графических процессоров A100-40G 🚀🚀. Обучение началось 01.09.2023. Мы использовали ту же архитектуру и токенизатор, что и Llama 2. Это означает, что TinyLlama можно подключать и использовать во многих проектах с открытым исходным кодом, созданных на основе Llama. Кроме того, TinyLlama компактна и имеет всего 1,1 млрд параметров. Эта компактность позволяет ему обслуживать множество приложений, требующих ограниченного объема вычислений и памяти. Это модель чата, настроенная поверх TinyLlama/TinyLlama-1.1B-intermediate-step-715k-1.5T. Используемый набор данных — OpenAssistant/oassttop12023-08-25 в формате Chatml. Вам понадобятся трансформаторы>=4.31. Для получения дополнительной информации посетите страницу Github TinyLlama.

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: TinyLlama
Теги: llama, en, text-generation-inference, endpoints_compatible
Лайков: 44 | Загрузок: 1,303

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

Undi95/Meta-Llama-3.1-8B-Claude

MaziyarPanahi/calme-2.4-rys-78b

TheBloke/medicine-chat-GGUF

abacaj/llama-161M-100B