AI-Sweden-Models/Llama-3-8B

![](https://huggingface.co/AI-Sweden-Models/Llama-3-8B/resolve/main/l3swe.png?download=true) Это базовая модель, ее можно настроить под конкретный вариант использования. AI-Sweden-Models/Llama-3-8B является продолжением процесса предварительного обучения из Meta-Lama/Meta-Llama-3-8B. Он был обучен на подмножестве из The Nordic Pile, содержащем шведский, норвежский и датский языки. Обучение проводится по всем параметрам модели, это полная настройка. Набор обучающих данных состоит из 227 105 079 296 токенов. Обучение проходило на суперкомпьютере Rattler в Инновационном центре Dell Technologies Edge в Остине, штат Техас. В обучении использовалось 23 узла продолжительностью 30 дней, причем один узел содержал 4 графических процессора Nvidia A100, что дало 92 графических процессора. ![](https://huggingface.co/AI-Sweden-Models/Llama-3-8B/resolve/main/13333333.jpg?download=true) 15.06.2024 (18833) => 1 эпоха 06.11.2024 (16000) 06.07.2024 (14375) 06.03.2024 (11525) 29.05.2024 (8200) 26.05.2024 (6550) 24.05.2024 (5325) 22.05.2024 (3900) 20.05.2024 (2700) 13.05.2024 (1500)

Модальности:
Генерация текста

Задача: Генерация текста
Автор: AI-Sweden-Models
Теги: llama, llama-3, ai-sweden, sv, da, no, text-generation-inference, endpoints_compatible
Лайков: 24 | Загрузок: 808

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

TheBloke/WizardCoder-Python-7B-V1.0-GPTQ

0xvoid0000/zira-researcher

MemGPT/dolphin-2.2-yi-34b-200k

davidkim205/komt-Llama-2-7b-chat-hf