Это Сузуме 8B, многоязычная версия Llama 3 (meta-llama/Meta-Llama-3-8B-Instruct). Llama 3 показала отличные результаты во многих тестах английского языка. Однако, по-видимому, он также был настроен в основном на английские данные, а это означает, что он будет отвечать на английском языке, даже если будет предложено на других языках. Мы настроили Llama 3 почти на 90 000 многоязычных разговоров, что означает, что эта модель обладает умом Llama 3, но имеет дополнительную возможность общаться на большем количестве языков. Пожалуйста, не стесняйтесь комментировать эту модель и оставлять отзывы на вкладке «Сообщество»! В будущем мы выпустим документ, описывающий, как мы создали обучающие данные, модель и проведенные на их основе оценки. Самый простой способ использовать эту модель на своем компьютере — использовать версию этой модели в формате GGUF (lightblue/suzume-llama-3-8B-multilingual-gguf) с помощью такой программы, как jan.ai или LM Studio. Если вы хотите использовать эту модель непосредственно в Python, мы рекомендуем использовать vLLM для максимальной скорости вывода. Мы получили следующие оценки MT-Bench на 6 языках: * (Обратите внимание, что оценки по русскому языку исключают проблемы с кодом, рассуждениями и математическими задачами из-за отсутствия переведенных справочных ответов на эти…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: lightblue
Теги: llama, generated_from_trainer, conversational, text-generation-inference, endpoints_compatible
Лайков: 114 | Загрузок: 14,276
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.