MediaTek-Research/Breexe-8x7B-Instruct-v0_1 - Каталог нейросетей
Генерация текста

MediaTek-Research/Breexe-8x7B-Instruct-v0_1

Добавлено:
MediaTek-Research/Breexe-8x7B-Instruct-v0_1

Breexe-8x7B — это семейство языковых моделей, созданное на основе Mixtral-8x7B и специально предназначенное для использования в традиционном китайском языке. Breexe-8x7B-Base — базовая модель серии Breexe-8x7B. Breexe-8x7B-Base расширяет исходный словарь дополнительными 30 000 токенами традиционного китайского языка. Благодаря расширенному словарю Breexe-8x7B работает в два раза быстрее, чем традиционный китайский язык по сравнению с Mixtral-8x7B. См. [Производительность вывода.] Breexe-8x7B-Instruct является производным от базовой модели Breexe-8x7B-Base, что позволяет использовать полученную модель в исходном виде для часто встречающихся задач, таких как вопросы и ответы, RAG, многораундовый чат и подведение итогов. Breexe-8x7B-Instruct демонстрирует впечатляющую производительность в тестах на традиционном китайском и английском языках, наравне с gpt-3.5-turbo-1106 от OpenAI. См. [Производительность модели чата]. Модели были обучены на Nvidia Taipei-1. Особая благодарность за техническую поддержку Nvidia. Проект участников (в алфавитном порядке): Чан-Янь Сюй 許湛然, Чан-Ле Лю 劉昶樂, Фэн-Тин Ляо 廖峰挺, По-Чун Сюй 許博竣, И-Чан Чен 陳宜昌 и руководитель Да-Шань Шиу許大山. Мы предлагаем пробный API для бизнес-интеграции и академического сравнительного анализа. Время работы сервиса API: 14:00 — 20:00…

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям


Задача: Генерация текста
Автор: MediaTek-Research
Теги: mixtral, conversational, en, zh, text-generation-inference, endpoints_compatible
Лайков: 55  |  Загрузок: 12

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.