Llama 2 — это набор предварительно обученных и точно настроенных генеративных текстовых моделей масштаба от 7 до 70 миллиардов параметров. Это репозиторий для точно настроенной модели 7B, оптимизированной для сценариев использования диалогов и преобразованной для формата Hugging Face Transformers. Ссылки на другие модели можно найти в указателе внизу. Meta разработала и публично выпустила семейство больших языковых моделей (LLM) Llama 2 — коллекцию предварительно обученных и точно настроенных генеративных текстовых моделей с масштабом от 7 до 70 миллиардов параметров. Наши доработанные LLM, называемые Llama-2-Chat, оптимизированы для сценариев использования диалога. Модели Llama-2-Chat превосходят модели чата с открытым исходным кодом по большинству протестированных нами тестов, а по нашим человеческим оценкам полезности и безопасности находятся на одном уровне с некоторыми популярными моделями чата с закрытым исходным кодом, такими как ChatGPT и PaLM. Вариации Llama 2 поставляется с различными размерами параметров — 7B, 13B и 70B, а также с предварительно обученными и точно настроенными вариантами. Архитектура модели Llama 2 — это авторегрессионная языковая модель, использующая оптимизированную архитектуру преобразователя. В настроенных версиях для согласования используются контролируемая точная настройка (SFT) и обучение с подкреплением с обратной связью от человека (RLHF).
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: NousResearch
Теги: llama, facebook, meta, llama-2, en, text-generation-inference
Лайков: 194 | Загрузок: 20,069
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.