1. Краткое описание модели 2. Использование 3. Ограничения 4. Обучение 5. Оценка 7. Цитирование > Мы представляем BLOOMZ и mT0, семейство моделей, способных с нулевой точностью следовать человеческим инструкциям на десятках языков. Мы настраиваем предварительно обученные многоязычные языковые модели BLOOM и mT5 на нашей межъязыковой смеси задач (xP3) и находим полученные модели, способные к межъязыковому обобщению для невидимых задач и языков. — Репозиторий: bigscience-workshop/xmtf — Документ: Межъязыковое обобщение посредством многозадачной точной настройки — Контактное лицо: Никлас Мюннигхофф — Языки: см. Bloom для предварительной подготовки и xP3 для точной настройки языковых пропорций. Он понимает как языки предварительной подготовки, так и языки тонкой настройки. — Семейство моделей BLOOMZ и mT0: многозадачность, оптимизированная для xP3. Рекомендуется для подсказок на английском языке. Параметры 300M 580M 1.2B 3.7B 13B 560M 1.1B 1.7B 3B 7.1B 176B Модель с точной настройкой mt0-small mt0-base mt0-large mt0-xl mt0-xxl Bloomz-560m Bloomz-1b1 Bloomz-1b7 Bloomz-3b Bloomz-7b1 Bloomz Многозадачность настроена на xP3mt. Рекомендуется для подсказок на языках, отличных от английского. Доработанная модель mt0-xxl-mt Bloomz-7b1-mt Bloomz-mt Многозадачность, настроенная на P3. Выпущено только для исследовательских целей. Строго хуже предыдущего…
Модальности:
Генерация текста
Области применения:
Генерация кода
Задача: Генерация текста
Автор: bigscience
Теги: tensorboard, bloom, ak, ar, as, bm, bn, ca
Лайков: 23 | Загрузок: 2,950
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.