Granite-8B-Code-Instruct-128K — это модель инструкций с длинным контекстом с 8B параметрами, точно настроенная на основе Granite-8B-Code-Base-128K на комбинации разрешенно лицензированных данных, используемых при обучении исходных моделей инструкций кода Granite, в дополнение к синтетически сгенерированным наборам данных кодовых инструкций, предназначенным для решения задач с длинным контекстом. Предоставляя модели как короткие, так и длинные контекстные данные, мы стремимся улучшить ее возможности работы с длинным контекстом, не жертвуя при этом производительностью генерации кода в коротком входном контексте. — Разработчики: IBM Research — Репозиторий GitHub: ibm-granite/granite-code-models — Документ: Масштабирование моделей кода Granite до контекста 128 КБ — Дата выпуска: 18 июля 2024 г. — Лицензия: Apache 2.0. Модель предназначена для реагирования на инструкции, связанные с кодированием, через длинные последовательные входные данные длиной до 128 КБ и может использоваться для создания помощников по кодированию. Это простой пример использования модели Granite-8B-Code-Instruct. Модели Granite Code Instruct обучаются на сочетании коротких и длинных контекстных данных следующим образом. Данные инструкций с коротким контекстом: CommitPackFT, BigCode-SC2-Instruct, MathInstruct, MetaMathQA, Glaive-Code-Assistant-v3, Glaive-Function-Calling-v2, NL2SQL11, HelpSteer, OpenPlatypus…
Модальности:
Генерация текста
Области применения:
Генерация кода Диалог / чат Следование инструкциям
Задача: Генерация текста
Автор: ibm-granite
Теги: llama, code, granite, conversational, model-index, text-generation-inference
Лайков: 25 | Загрузок: 1,140
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.