Эта модель обучена на моем наборе данных Code-290k-ShareGPT и Code-Feedback. Он настроен на Jamba-v0.1. Он очень хорош для генерации кода на различных языках, таких как Python, Java, JavaScript, GO, C++, Rust, Ruby, Sql, MySql, R, Julia, Haskell и т. д. Эта модель также будет генерировать подробные объяснения/логику каждого кода. В этой модели используется формат приглашений ChatML. Весь набор данных был обучен на 2 x H100 94 ГБ. За 3 эпохи обучение заняло 162 часа. Аксолотль вместе с кодовой базой DeepSpeed использовался в учебных целях. Это было обучено AI21Labs на Jamba-v0.1. Это модель qlora. Ссылки на квантовые модели будут обновлены очень скоро. Я хочу выразить особую благодарность сообществу Open Source за то, что помогли мне лучше понять разработку ИИ/моделей.
Модальности:
Генерация текста
Области применения:
Генерация кода Диалог / чат
Языки программирования:
Python C++ Rust Ruby R SQL
Задача: Генерация текста
Автор: ajibawa-2023
Теги: jamba, code, Python, C++, Rust, Ruby, Sql, R
Лайков: 7 | Загрузок: 9
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.