Встречайте BgGPT-7B, модель болгарского языка, обученную на mistralai/Mistral-7B-v0.1. BgGPT распространяется под лицензией Apache 2.0. Эта модель была создана Институтом INSAIT, входящим в состав Софийского университета, в Софии, Болгария. Модель точно настроена для улучшения возможностей болгарского языка с использованием нескольких наборов данных, включая данные веб-сканирования на болгарском языке, ряд специализированных наборов данных на болгарском языке, полученных от Института INSAIT, и машинные переводы популярных наборов данных на английский язык. Эти болгарские данные были дополнены наборами данных на английском языке, чтобы сохранить навыки английского языка и логического мышления. Токенизатор модели был расширен, чтобы обеспечить более эффективное кодирование болгарских слов, написанных кириллицей. Это не только увеличивает пропускную способность кириллического текста, но и производительность. Чтобы использовать точную настройку инструкций, ваше приглашение должно быть окружено токенами [INST] и [/INST]. Самая первая инструкция должна начинаться с маркера начала предложения. Следовать инструкциям не следует. Генерация помощника будет завершена маркером конца предложения. Этот формат доступен в виде шаблона чата с помощью метода applychattemplate(): Модель поставляется с набором тестов, которые…
Модальности:
Генерация текста
Области применения:
Следование инструкциям Диалог / чат
Задача: Генерация текста
Автор: INSAIT-Institute
Теги: mistral, instruct, bggpt, insait, conversational, bg, text-generation-inference, endpoints_compatible
Лайков: 46 | Загрузок: 24
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.