Эта модель представляет собой доработанную версию bigscience/bloom-560m на наборе данных Gustavosta/Stable-Diffusion-Prompts. В наборе оценок он достигает следующих результатов: — Потеря: 0,8742. Во время обучения использовались следующие гиперпараметры: — скорость обучения: 5e-05 — trainbatchsize: 1 — evalbatchsize: 1 — начальное значение: 42 — градиентаккумуляция шагов: 4 — totaltrainbatchsize: 4 — оптимизатор: Адам с betas=(0,9,0,999) и epsilon=1e-08 — lrschedulertype: линейный — numepochs: 2 — mixprecision_training: Native AMP — Transformers 4.22.1 — Pytorch 1.12.1+cu113 — Наборы данных 2.5.1 — Токенизаторы 0.12.1
Модальности:
Генерация текста
Задача: Генерация текста
Автор: mrm8488
Теги: tensorboard, bloom, generated_from_trainer, stable-diffusion, diffusion, text-generation-inference, endpoints_compatible
Лайков: 31 | Загрузок: 23
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.