TinyLlama/TinyLlama-1.1B-intermediate-step-240k-503b

Целью проекта TinyLlama является предварительное обучение модели Llama размером 1,1 млрд на 3 триллионах токенов. При правильной оптимизации мы можем достичь этого «всего» за 90 дней, используя 16 графических процессоров A100-40G 🚀🚀. Обучение началось 01.09.2023. Мы использовали ту же архитектуру и токенизатор, что и Llama 2. Это означает, что TinyLlama можно подключать и использовать во многих проектах с открытым исходным кодом, созданных на основе Llama. Кроме того, TinyLlama компактна и имеет всего 1,1 млрд параметров. Эта компактность позволяет ему обслуживать множество приложений, требующих ограниченного объема вычислений и памяти. Это промежуточный контрольно-пропускной пункт с 240 тысячами шагов и 503 миллиардами токенов. Мы предлагаем вам не использовать это напрямую для вывода. Модель чата всегда предпочтительнее. ** Вам потребуются трансформеры>=4.31. Для получения дополнительной информации посетите страницу Github TinyLlama.

Модальности:
Генерация текста

Задача: Генерация текста
Автор: TinyLlama
Теги: llama, en, text-generation-inference, endpoints_compatible
Лайков: 20 | Загрузок: 1,311

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

kyujinpy/KO-Platypus2-13B

gorilla-llm/gorilla-7b-hf-delta-v1

prhegde/t5-query-reformulation-RL

aifeifei798/Qwen3.5-Queen-27B