Мистраль-Про — это прогрессивная версия оригинальной модели Мистраль, улучшенная за счет добавления блоков Трансформер. Он специализируется на интеграции как общего понимания языка, так и знаний по конкретной предметной области, особенно в области программирования и математики. Developed by Tencent’s ARC Lab, Mistral-Pro is an 8 billion parameter model. Это расширение Мистраля-7Б, дополнительно обученное программированию и математике. Эта модель предназначена для широкого спектра задач НЛП с упором на программирование, математику и общеязыковые задачи. Он подходит для сценариев, требующих интеграции естественных языков и языков программирования. MistralPro8B_v0.1 демонстрирует превосходную производительность в ряде тестов. Это улучшает кодовую и математическую производительность Mistral. Более того, он соответствует характеристикам недавно доминирующей модели Gemma. Хотя Mistral-Pro устраняет некоторые ограничения предыдущих моделей этой серии, он все еще может сталкиваться с проблемами, характерными для узкоспециализированных областей или задач. Пользователи должны знать о потенциальных отклонениях в модели и использовать ее ответственно, учитывая ее влияние на различные приложения.
Модальности:
Генерация текста
Задача: Генерация текста
Автор: TencentARC
Теги: mistral, en, text-generation-inference, endpoints_compatible
Лайков: 66 | Загрузок: 130
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.