sambanovasystems/SambaLingo-Japanese-Base

SambaLingo-Japanese-Base — это предварительно обученная двуязычная японско-английская модель, которая адаптирует Llama-2-7b к японскому языку путем обучения на 42 миллиардах токенов из японского разделения набора данных Cultura-X. Эта модель сообщает о современных результатах оценки недоумения и перевода FLORES-200. Для версии этой модели для чата см. sambanovasystems/SambaLingo-Japanese-Chat. — Разработано: SambaNova Systems — Тип модели: Языковая модель — Язык(и): японский, английский — Доработано на основе модели: Llama 2 — Документ: SambaLingo: Обучение новым языкам на больших языковых моделях — Сообщение в блоге: Эксперты по языкам с открытым исходным кодом SambaLingo Мы предлагаем установить do_sample=False, поскольку это предварительно обученная контрольная точка. Эта модель представляет собой предварительно обученную контрольную точку, поэтому для ее эффективного использования используйте несколько подсказок с примерами. Единственный другой требуемый шаблон приглашения — это стандартный токен (BOS) из токенизатора Llama. Если вы хотите взаимодействовать с этой моделью с помощью прямых вопросов или запросов, используйте версию модели для чата, согласованную с человеческими предпочтениями sambanovasystems/SambaLingo-Japanese-Chat. Вся предварительная подготовка проводится на наборе данных Cultura-X. Мы смешиваем данные так, чтобы 75% данных были получены из…

Модальности:
Генерация текста

Задача: Генерация текста
Автор: sambanovasystems
Теги: llama, ja, en, text-generation-inference, endpoints_compatible
Лайков: 25 | Загрузок: 14

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Weyaxi/Einstein-v7-Qwen2-7B

Lewdiculous/mistral-7b-v0.1-layla-v4-GGUF-IQ-Imatrix

Qwen/Qwen-1_8B-Chat-Int4

yasserrmd/ConstructionSafetyQA-1.2B-V1