bigscience/mt0-xl - Каталог нейросетей
Генерация текста

bigscience/mt0-xl

Добавлено:
bigscience/mt0-xl

1. Краткое описание модели 2. Использование 3. Ограничения 4. Обучение 5. Оценка 7. Цитирование > Мы представляем BLOOMZ и mT0, семейство моделей, способных с нулевой точностью следовать человеческим инструкциям на десятках языков. Мы настраиваем предварительно обученные многоязычные языковые модели BLOOM и mT5 на нашей межъязыковой смеси задач (xP3) и обнаруживаем, что полученные модели способны к межъязыковому обобщению для невидимых задач и языков. — Репозиторий: bigscience-workshop/xmtf — Документ: Межъязыковое обобщение посредством многозадачной точной настройки — Контактное лицо: Никлас Мюннигхофф — Языки: см. mc4 для предварительной подготовки и xP3 для точной настройки языковых пропорций. Он понимает как языки предварительной подготовки, так и языки тонкой настройки. — Семейство моделей BLOOMZ и mT0: многозадачность, оптимизированная для xP3. Рекомендуется для подсказок на английском языке. Параметры 300M 580M 1.2B 3.7B 13B 560M 1.1B 1.7B 3B 7.1B 176B Модель с точной настройкой mt0-small mt0-base mt0-large mt0-xl mt0-xxl Bloomz-560m Bloomz-1b1 Bloomz-1b7 Bloomz-3b Bloomz-7b1 Bloomz Многозадачность настроена на xP3mt. Рекомендуется для подсказок на языках, отличных от английского. Доработанная модель mt0-xxl-mt Bloomz-7b1-mt Bloomz-mt Многозадачность, доработанная на P3. Выпущено только для исследовательских целей. Строго хуже предыдущего…

Модальности:
Генерация текста


Задача: Генерация текста
Автор: bigscience
Теги: mt5, text2text-generation, af, am, ar, az, be, bg
Лайков: 32  |  Загрузок: 2,022

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.