ibm-granite/granite-8b-code-instruct-128k

Granite-8B-Code-Instruct-128K — это модель инструкций с длинным контекстом с 8B параметрами, точно настроенная на основе Granite-8B-Code-Base-128K на комбинации разрешенно лицензированных данных, используемых при обучении исходных моделей инструкций кода Granite, в дополнение к синтетически сгенерированным наборам данных кодовых инструкций, предназначенным для решения задач с длинным контекстом. Предоставляя модели как короткие, так и длинные контекстные данные, мы стремимся улучшить ее возможности работы с длинным контекстом, не жертвуя при этом производительностью генерации кода в коротком входном контексте. — Разработчики: IBM Research — Репозиторий GitHub: ibm-granite/granite-code-models — Документ: Масштабирование моделей кода Granite до контекста 128 КБ — Дата выпуска: 18 июля 2024 г. — Лицензия: Apache 2.0. Модель предназначена для реагирования на инструкции, связанные с кодированием, через длинные последовательные входные данные длиной до 128 КБ и может использоваться для создания помощников по кодированию. Это простой пример использования модели Granite-8B-Code-Instruct. Модели Granite Code Instruct обучаются на сочетании коротких и длинных контекстных данных следующим образом. Данные инструкций с коротким контекстом: CommitPackFT, BigCode-SC2-Instruct, MathInstruct, MetaMathQA, Glaive-Code-Assistant-v3, Glaive-Function-Calling-v2, NL2SQL11, HelpSteer, OpenPlatypus…

Модальности:
Генерация текста

Области применения:
Генерация кода Диалог / чат Следование инструкциям

Задача: Генерация текста
Автор: ibm-granite
Теги: llama, code, granite, conversational, model-index, text-generation-inference
Лайков: 25 | Загрузок: 1,140

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

TheBloke/UndiMix-v4-13B-GPTQ

openlm-research/open_llama_7b

cccczshao/CALM-XL

TheBloke/Llama-2-7B-Chat-GPTQ