joaoalvarenga/bloom-8bit - Каталог нейросетей
Генерация текста

joaoalvarenga/bloom-8bit

Добавлено:
joaoalvarenga/bloom-8bit

Эта версия bigscience/bloom, во многом вдохновленная GPT-J-6B от Hivemind с 8-битными весами, представляет собой языковую модель с ~176 миллиардами параметров, которую вы запускаете и настраиваете с меньшим объемом памяти. Здесь мы также применяем LoRA (адаптацию низкого ранга), чтобы уменьшить размер модели. Исходная версия занимает ~353 ГБ памяти, эта версия занимает ~180 ГБ. Наша главная цель — создать модель, достаточно сжатую для развертывания в традиционном кластере Kubernetes. В этом ноутбуке вы можете найти адаптацию 8-битного ноутбука тонкой настройки Hivemind GPT-J для тонкой настройки 8-битного Bloom с 3 экземплярами NVIDIA A100. Эту модель можно использовать, адаптировав оригинальную реализацию Bloom. Это адаптация 8-битной версии GPT-J от Hivemind:

Модальности:
Генерация текста


Задача: Генерация текста
Автор: joaoalvarenga
Теги: bloom, ak, ar, as, bm, bn, ca, en
Лайков: 75  |  Загрузок: 28

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.