edumunozsala/llama-2-7b-int4-python-code-20k

LlaMa-2 7b точно настроен на наборе данных инструкций кода pythoncodeinstructions18kalpaca с использованием метода QLoRA в 4-битной версии с библиотекой PEFT. Meta разработала и публично выпустила семейство больших языковых моделей (LLM) Llama 2 — коллекцию предварительно обученных и точно настроенных генеративных текстовых моделей с масштабом от 7 до 70 миллиардов параметров. Архитектура модели Llama 2 — это авторегрессионная языковая модель, использующая оптимизированную архитектуру преобразователя. В настроенных версиях используется контролируемая точная настройка (SFT) и обучение с подкреплением с обратной связью от человека (RLHF) для согласования с предпочтениями человека в отношении полезности и безопасности. Набор данных содержит описания проблем и код на языке Python. Этот набор данных взят из файла sahil2801/codeinstructions120k, который добавляет столбец подсказок в стиле альпаки. Во время обучения использовалась следующая конфигурация квантования битов и байтов: — loadin8bit: False — loadin4bit: True — llmint8threshold: 6.0 — llmint8skipmodules: None — llmint8enablefp32cpuoffload: False — llmint8hasfp16weight: False — bnb4bitquanttype: nf4 — bnb4bitusedoublequant: False — bnb4bitcomputedtype: float16

Модальности:
Генерация текста

Области применения:
Генерация кода

Языки программирования:
Python

Задача: Генерация текста
Автор: edumunozsala
Теги: llama, generated_from_trainer, code, coding, llama-2, text-generation-inference, endpoints_compatible
Лайков: 15 | Загрузок: 11

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Tweeties/tweety-7b-tatar-v24a

Dogge/llama-3-70B-instruct-uncensored

serpdotai/sparsetral-16x7B-v2

FPHam/Free_Sydney_13b_HF