Языковая модель для персидского языка. Модель имеет 1,3В параметров, как можно догадаться по названию. Персидский принадлежит к индоевропейской языковой семье. Это очень поэтичный язык, на котором говорят около 110 миллионов человек. Вот некоторые факты о нем: 1. Он также известен как фарси, и на нем преимущественно говорят в Иране, Афганистане и Таджикистане. 2. Персидский язык имеет богатую литературную традицию, среди которой есть такие знаковые поэты, как Руми, Хафез и Фирдоуси. 3. Он использует персидское письмо, которое является вариантом арабского письма. Это одна из моделей, созданных на основе базовой модели mGPT-XL (1.3B) (см. список ниже), которая изначально обучалась на 61 языке из 25 языковых семей с использованием Википедии и корпуса C4. Мы нашли дополнительные данные для 23 языков, большинство из которых считаются второстепенными, и решили доработать базовую модель. Персидский mGPT 1.3B был обучен еще на 200 шагов с размером пакета = 4 и контекстным окном из 2048** токенов на 1 A100. — 🇦🇲 mGPT-1.3B Армянский — 🇦🇿 mGPT-1.3B Азербайджан — 🍯 mGPT-1.3B Башкирский — 🇧🇾 mGPT-1.3B Белорусский — 🇧🇬 mGPT-1.3B Болгарский — 🌞 mGPT-1.3B Бурятский — 🌳 мГПТ-1.3Б Чувашский — 🇬🇪 мГПТ-1.3Б Грузинский — 🌸 мГПТ-1.3Б Калмыцкий — 🇰🇿 мГПТ-1.3Б Казахский — 🇰🇬 мГПТ-1.3Б Киргизский — 🐻 мГПТ-1.3Б…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: ai-forever
Теги: gpt2, gpt3, mgpt, fa, en, ru, text-generation-inference, endpoints_compatible
Лайков: 13 | Загрузок: 799
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.