WangChanLion — это многоязычный, настроенный на языки Юго-Восточной Азии SEA-LION 7B с использованием образцов коммерчески допустимых наборов данных с открытым исходным кодом из LAION OIGchip2 и infilldbpedia, DataBricks Dolly v2, OpenAI TL;DR, Hello-SimpleAI HC3, dolphin, iappwikiqasquad, thaisum, xlsum, scbmtenth_2020, набор данных han, xp3x и Open-Platypus, всего ~500 тыс. образцов. Некоммерческие наборы данных были отфильтрованы. Выпущено под лицензией Apache 2.0. Модели обучены выполнять подмножество задач по выполнению инструкций, которые мы считаем наиболее актуальными: понимание прочитанного, мозговой штурм и творческое письмо. В этой модели мы ориентируемся на наборы данных на тайском и английском языках. Мы проводим оценку в стиле Викуньи, используя оценку человека. Как и в Dolly v2, мы используем только коммерчески разрешенные предварительно обученные модели и наборы данных с открытым исходным кодом. Наши модели не ограничены ни некоммерческими положениями, такими как модели на основе LLaMA, ни положениями о неконкуренции, такими как модели, использующие наборы данных самообучения из ChatGPT. — Разработчики: PyThaiNLP и Таиландский научно-исследовательский институт искусственного интеллекта VISTEC-depa — Тип модели: SEA-LION 7B (архитектура MPT) — Репозиторий: https://github.com/vistec-AI/WangchanLion — Демо:…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: airesearch
Теги: mpt, custom_code, th, en, text-generation-inference, endpoints_compatible
Лайков: 7 | Загрузок: 27
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.