Доработанный Llama-2 13B с нецензурированным/нефильтрованным набором данных разговоров Волшебника и Викуньи ehartford/wizardvicuna70k_unfiltered. Для тонкой настройки использовал QLoRA. Обучение в течение одной эпохи на двух экземплярах графических процессоров по 24 ГБ (NVIDIA RTX 3090) заняло около 26,5 часов. Благодаря TheBloke он создал версии GGML и GPTQ: https://huggingface.co/TheBloke/Llama-2-13B-GGML https://huggingface.co/TheBloke/Llama-2-13B-GPTQ
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: arogov
Теги: tensorboard, llama, text-generation-inference, endpoints_compatible
Лайков: 13 | Загрузок: 17
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.