Sailor2 — это инициатива сообщества, которая внедряет передовые многоязычные языковые модели в Юго-Восточную Азию (ЮВА). Наше исследование подчеркивает высокий спрос на модели с диапазоном параметров 8B и 20B для промышленного использования, а также на модели 1B для специализированных приложений, таких как спекулятивное декодирование и исследовательские цели. Эти модели, выпущенные по лицензии Apache 2.0, обеспечивают расширенный доступ к передовым языковым технологиям во всем регионе. Sailor2 основан на потрясающей многоязычной модели Qwen 2.5 и постоянно проходит предварительное обучение на 500B токенах, чтобы лучше поддерживать 15 языков с помощью унифицированной модели. К этим языкам относятся английский, китайский, бирманский, кебуанский, илоканский, индонезийский, яванский, кхмерский, лаосский, малайский, сунданский, тагальский, тайский, вьетнамский и варайский. Удовлетворяя растущий спрос на разнообразные, надежные и доступные языковые модели, Sailor2 стремится обслуживать малообеспеченные слои населения в регионах ЮВА с помощью открытых, инклюзивных и доступных многоязычных программ LLM. Модель Sailor2 выпускается в трех размерах: 1B, 8B и 20B, которые являются расширенными по сравнению с базовыми моделями Qwen2.5 0,5B, 7B и 14B соответственно. — Коллекции моделей: базовая модель и модель чата — Проект…
Модальности:
Генерация текста
Области применения:
Диалог / чат Мультиязычность
Задача: Генерация текста
Автор: sail
Теги: qwen2, multilingual, sea, sailor, conversational, en, zh, id
Лайков: 10 | Загрузок: 31
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.