 Это базовая модель, ее можно настроить под конкретный вариант использования. AI-Sweden-Models/Llama-3-8B является продолжением процесса предварительного обучения из Meta-Lama/Meta-Llama-3-8B. Он был обучен на подмножестве из The Nordic Pile, содержащем шведский, норвежский и датский языки. Обучение проводится по всем параметрам модели, это полная настройка. Набор обучающих данных состоит из 227 105 079 296 токенов. Обучение проходило на суперкомпьютере Rattler в Инновационном центре Dell Technologies Edge в Остине, штат Техас. В обучении использовалось 23 узла продолжительностью 30 дней, причем один узел содержал 4 графических процессора Nvidia A100, что дало 92 графических процессора.  15.06.2024 (18833) => 1 эпоха 06.11.2024 (16000) 06.07.2024 (14375) 06.03.2024 (11525) 29.05.2024 (8200) 26.05.2024 (6550) 24.05.2024 (5325) 22.05.2024 (3900) 20.05.2024 (2700) 13.05.2024 (1500)
Модальности:
Генерация текста
Задача: Генерация текста
Автор: AI-Sweden-Models
Теги: llama, llama-3, ai-sweden, sv, da, no, text-generation-inference, endpoints_compatible
Лайков: 24 | Загрузок: 808
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.