ibm-granite/granite-7b-instruct

[*] Номера для моделей, отличных от Merlinite-7b-lab, Granite-7b-lab и Labradorite-13b, взяты из lmsys/chatbot-arena-leaderboard LAB: Крупномасштабное выравнивание для чат-ботов — это новый метод настройки выравнивания на основе синтетических данных для LLM от IBM Research. Granite-7b-lab — это производная модель на основе Granite-7b, обученная по методологии LAB с использованием Mixtral-8x7b-Instruct в качестве модели преподавателя. 1. Процесс курирования данных на основе таксономии. 2. Крупномасштабный генератор синтетических данных. 3. Двухфазное обучение с буферами воспроизведения. Подход LAB позволяет постепенно добавлять новые знания и навыки к уже предварительно обученной модели, не страдая от катастрофического забывания. Таксономия — это дерево исходных примеров, которые используются, чтобы побудить модель учителя генерировать синтетические данные. Таксономия позволяет куратору данных или разработчику модели легко указать разнообразный набор областей знаний и навыков, которые они хотели бы включить в свой LLM. На высоком уровне их можно разделить на три категории высокого уровня: знания, базовые навыки и навыки композиции. Листовые узлы таксономии — это задачи, связанные с одним или несколькими исходными примерами. Во время синтетических данных…

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям

Задача: Генерация текста
Автор: ibm-granite
Теги: llama, granite, ibm, lab, labrador, labradorite, conversational, en
Лайков: 9 | Загрузок: 595

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

grimjim/llama-3-Nephilim-v3-8B-GGUF

snorkelai/Snorkel-Mistral-PairRM-DPO

rhaymison/Llama-3-portuguese-Tom-cat-8b-instruct

RedHatAI/Qwen3-VL-235B-A22B-Instruct-NVFP4