Коллекция многоязычных моделей больших языков (LLM) Meta Llama 3.1 представляет собой коллекцию предварительно обученных и настроенных на инструкции генеративных моделей размером 8B, 70B и 405B (ввод/вывод текста). Модели Llama 3.1, настроенные только на текст (8B, 70B, 405B), оптимизированы для сценариев использования многоязычного диалога и превосходят многие доступные модели с открытым исходным кодом и закрытым чатом по общим отраслевым тестам. Архитектура модели: Llama 3.1 — это авторегрессионная языковая модель, использующая оптимизированную архитектуру преобразователя. В настроенных версиях используется контролируемая точная настройка (SFT) и обучение с подкреплением с обратной связью от человека (RLHF), чтобы соответствовать предпочтениям человека в отношении полезности и безопасности. Параметры обучающих данных Модальность ввода Модальность вывода Длина контекста GQA Количество токенов Ограничение знаний Llama 3.1 (только текст) Новое сочетание общедоступных онлайн-данных. 8B Многоязычный текст Многоязычный текст и код 128k Да 15T+ Декабрь 2023 г. 70B Многоязычный текст Многоязычный текст и код 128k Да 405B Многоязычный текст Многоязычный текст и код 128k Да Поддерживаемые языки: английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский. Лама 3.1 семейство…
Модальности:
Генерация текста
Области применения:
Диалог / чат Следование инструкциям
Задача: Генерация текста
Автор: meta-llama
Теги: llama, facebook, meta, llama-3, conversational, en, de, fr
Лайков: 193 | Загрузок: 21,946
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.