Rallio67/7B-redpajama-conditional-alpha

Большие языковые модели (LLM), такие как ChatGPT OpenAI и аналогичные продукты чат-ботов других организаций, в последнее время получили широкое распространение. Эти модели могут расширять текст или реагировать на инструкции естественным и полезным способом. Несмотря на то, что основные технологии, лежащие в основе LLM, а именно архитектура преобразователя и причинно-следственная языковая модель только для декодера GPT, остаются относительно неизменными на протяжении более пяти лет, всплеск популярности ChatGPT во многом можно объяснить недавними подходами, которые лучше согласовывают результаты LLM с намерениями пользователей и поставщиков услуг. 1. Точная настройка с учителем (SFT) на основе естественных инструкций 2. Обучение с подкреплением на основе обратной связи от человека (RLHF). — Использует большое количество примеров предварительного обучения, помеченных понятными человеку классификаторами. — Использует теги контента, встречающиеся во многих онлайн-средах. — Примеры часто используемых тегов: — Подходит для работы (SFW) и не подходит для работы (NSFW) — G, PG, PG-13 и R для теле- и киноконтента — Традиционный предварительное обучение включает в себя предсказание последующего слова в минимально обработанном тексте. — Условное предварительное обучение добавляет обучающие примеры с описательными тегами и кратким обзором. -…

Модальности:
Генерация текста

Задача: Генерация текста
Автор: Rallio67
Теги: gpt_neox, text-generation-inference, endpoints_compatible
Лайков: 7 | Загрузок: 462

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

SIC98/GPT2-python-code-generator

euclaise/Memphis-scribe-3B

Skywork/Skywork-MoE-Base-FP8

taide/b.1.0.0