meta-llama/Llama-3.1-405B-Instruct-FP8

Коллекция многоязычных моделей больших языков (LLM) Meta Llama 3.1 представляет собой коллекцию предварительно обученных и настроенных на инструкции генеративных моделей размером 8B, 70B и 405B (ввод/вывод текста). Модели Llama 3.1, настроенные только на текст (8B, 70B, 405B), оптимизированы для сценариев использования многоязычного диалога и превосходят многие доступные модели с открытым исходным кодом и закрытым чатом по общим отраслевым тестам. Архитектура модели: Llama 3.1 — это авторегрессионная языковая модель, использующая оптимизированную архитектуру преобразователя. В настроенных версиях используется контролируемая точная настройка (SFT) и обучение с подкреплением с обратной связью от человека (RLHF), чтобы соответствовать предпочтениям человека в отношении полезности и безопасности. Параметры обучающих данных Модальность ввода Модальность вывода Длина контекста GQA Количество токенов Ограничение знаний Llama 3.1 (только текст) Новое сочетание общедоступных онлайн-данных. 8B Многоязычный текст Многоязычный текст и код 128k Да 15T+ Декабрь 2023 г. 70B Многоязычный текст Многоязычный текст и код 128k Да 405B Многоязычный текст Многоязычный текст и код 128k Да Поддерживаемые языки: английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский. Лама 3.1 семейство…

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям

Задача: Генерация текста
Автор: meta-llama
Теги: llama, facebook, meta, llama-3, conversational, en, de, fr
Лайков: 193 | Загрузок: 21,946

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

KoboldAI/GPT-Neo-2.7B-Horni-LN

SinclairSchneider/dbrx-instruct-quantization-fixed

Melikshah/dc_ops_grpo_lora

bartowski/CohereForAI_c4ai-command-a-03-2025-GGUF