NousResearch/Yarn-Llama-2-70b-32k

Авторы хотели бы поблагодарить LAION AI за поддержку вычислений для этой модели. Обучение проводилось на суперкомпьютере JUWELS. Nous-Yarn-Llama-2-70b-32k — это современная языковая модель для длинного контекста, дополнительно обученная на данных длинного контекста в течение 400 шагов с использованием метода расширения YaRN. Это расширение Llama-2-70b-hf и поддерживает контекстное окно размером 32 тыс. токенов. Чтобы использовать, передайте, например,trustremotecode=True при загрузке модели. Кроме того, вам нужно будет использовать последнюю версию преобразователей (до выхода 4.35). Короткие контекстные тесты, показывающие, что ухудшение качества минимально: — bloc97: методы, бумага и оценки — @theemozilla: методы, бумага, обучение модели и оценки — @EnricoShippole: обучение модели — honglu2875: бумага и оценки

Модальности:
Генерация текста

Задача: Генерация текста
Автор: NousResearch
Теги: llama, custom_code, en, text-generation-inference, endpoints_compatible
Лайков: 37 | Загрузок: 160

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

yasserrmd/Text2SQL-1.5B

TheBloke/MXLewdMini-L2-13B-GPTQ

bartowski/Qwen2-72B-Instruct-GGUF

anthracite-org/magnum-v2.5-12b-kto-exl2