Эта модель загружена в FP16 (в два раза меньше исходной точно настроенной загрузки, для упрощения загрузки). Эта модель точно настроена как для CodeAlpaca Sahil2801, так и для GPTeacher Code-Instruct от Teknium, чтобы предоставить возможности инструкции модели кода Replit. Попробуйте эту модель на демо-версии HuggingFace. Пространства: https://huggingface.co/spaces/teknium/Replit-v1-CodeInstruct-3B Ссылки на наборы данных: CodeAlpaca: https://huggingface.co/datasets/sahil2801/CodeAlpaca-20k Подмножество GPTeacher — инструкция по коду: https://github.com/teknium1/GPTeacher Эта модель прошел обучение на 2x a100 80 ГБ в течение 1 часа на ~ 25 000 парах кодов инструкция/ответ в формате Alpaca. Обратитесь к карточке модели HuggingFace базовой модели, чтобы узнать о некоторых основных требованиях для запуска: https://huggingface.co/replit/replit-code-v1-3b У этой модели, похоже, есть проблемы с устройством = auto в аргументах модели (и требуется TrustRemotecode = True, поэтому вам, возможно, следует загрузить ее так, как я здесь: Эта модель для меня выдавала последовательные выходные данные со следующими настройками сэмплера, но не стесняйтесь экспериментировать: в аргументах декодирования токенизатора это также необходимы эти настройки: Следующие параметры использовались в тренажере HuggingFace для обучения модели:
Модальности:
Генерация текста
Области применения:
Генерация кода Следование инструкциям
Задача: Генерация текста
Автор: teknium
Теги: mpt, code, instruct, self instruct, custom_code, text-generation-inference, endpoints_compatible
Лайков: 14 | Загрузок: 22
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.