Целью проекта TinyLlama является предварительное обучение модели Llama размером 1,1 млрд на 3 триллионах токенов. При правильной оптимизации мы можем достичь этого «всего» за 90 дней, используя 16 графических процессоров A100-40G 🚀🚀. Обучение началось 01.09.2023. Мы использовали ту же архитектуру и токенизатор, что и Llama 2. Это означает, что TinyLlama можно подключать и использовать во многих проектах с открытым исходным кодом, созданных на основе Llama. Кроме того, TinyLlama компактна и имеет всего 1,1 млрд параметров. Эта компактность позволяет ему обслуживать множество приложений, требующих ограниченного объема вычислений и памяти. Это промежуточный контрольно-пропускной пункт с 240 тысячами шагов и 503 миллиардами токенов. Мы предлагаем вам не использовать это напрямую для вывода. Модель чата всегда предпочтительнее. ** Вам потребуются трансформеры>=4.31. Для получения дополнительной информации посетите страницу Github TinyLlama.
Модальности:
Генерация текста
Задача: Генерация текста
Автор: TinyLlama
Теги: llama, en, text-generation-inference, endpoints_compatible
Лайков: 20 | Загрузок: 1,311
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.