[*] Номера для моделей, отличных от Merlinite-7b-lab, Granite-7b-lab и Labradorite-13b, взяты из lmsys/chatbot-arena-leaderboard LAB: Крупномасштабное выравнивание для чат-ботов — это новый метод настройки выравнивания на основе синтетических данных для LLM от IBM Research. Granite-7b-lab — это производная модель на основе Granite-7b, обученная по методологии LAB с использованием Mixtral-8x7b-Instruct в качестве модели преподавателя. 1. Процесс курирования данных на основе таксономии. 2. Крупномасштабный генератор синтетических данных. 3. Двухфазное обучение с буферами воспроизведения. Подход LAB позволяет постепенно добавлять новые знания и навыки к уже предварительно обученной модели, не страдая от катастрофического забывания. Таксономия — это дерево исходных примеров, которые используются, чтобы побудить модель учителя генерировать синтетические данные. Таксономия позволяет куратору данных или разработчику модели легко указать разнообразный набор областей знаний и навыков, которые они хотели бы включить в свой LLM. На высоком уровне их можно разделить на три категории высокого уровня: знания, базовые навыки и навыки композиции. Листовые узлы таксономии — это задачи, связанные с одним или несколькими исходными примерами. Во время синтетических данных…
Модальности:
Генерация текста
Области применения:
Диалог / чат Следование инструкциям
Задача: Генерация текста
Автор: ibm-granite
Теги: llama, granite, ibm, lab, labrador, labradorite, conversational, en
Лайков: 9 | Загрузок: 595
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.