Целью проекта TinyLlama является предварительное обучение модели Llama размером 1,1 млрд на 3 триллионах токенов. При правильной оптимизации мы можем достичь этого «всего» за 90 дней, используя 16 графических процессоров A100-40G 🚀🚀. Обучение началось 01.09.2023. Мы использовали ту же архитектуру и токенизатор, что и Llama 2. Это означает, что TinyLlama можно подключать и использовать во многих проектах с открытым исходным кодом, созданных на основе Llama. Кроме того, TinyLlama компактна и имеет всего 1,1 млрд параметров. Эта компактность позволяет ему обслуживать множество приложений, требующих ограниченного объема вычислений и памяти. Это модель чата, настроенная поверх TinyLlama/TinyLlama-1.1B-intermediate-step-715k-1.5T. Используемый набор данных — OpenAssistant/oassttop12023-08-25 в формате Chatml. Вам понадобятся трансформаторы>=4.31. Для получения дополнительной информации посетите страницу Github TinyLlama.
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: TinyLlama
Теги: llama, en, text-generation-inference, endpoints_compatible
Лайков: 44 | Загрузок: 1,303
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.