SambaLingo-Arabic-Chat — это модель чата, ориентированная на человека, обученная на арабском и английском языках. Он обучается с использованием прямой оптимизации предпочтений на основе базовой модели SambaLingo-Arabic-Base. Базовая модель адаптирует Llama-2-7b к арабскому языку путем обучения на 63 миллиардах токенов из арабского разделения набора данных Cultura-X. Попробуйте эту модель на SambaLingo-chat-space. — Разработчик: SambaNova Systems — Тип модели: Языковая модель — Язык(и): арабский, английский — Доработано на основе модели: Llama-2-7b — Попробуйте эту модель: SambaLingo-chat-space — Документ: SambaLingo: Обучение новым языкам на больших языковых моделях — Сообщение в блоге: sambalingo-open-source-language-experts Обязательно установите use_fast=False при загрузке токенизатора. Обязательно установите use_fast=False при загрузке токенизатора. Чтобы предложить эту модель, используйте следующий шаблон чата: Фаза согласования соответствует рецепту для Zephyr-7B и состоит из двух этапов: контролируемая точная настройка (SFT) и прямая оптимизация производительности (DPO). Фаза SFT выполнялась на наборе данных ultrachat200k, смешанном с переведенной Google версией набора данных ultrachat200k. Он был обучен для одной эпохи с глобальным размером пакета 512 и максимальной длиной последовательности 2048 токенов.…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: sambanovasystems
Теги: llama, conversational, ar, en, text-generation-inference, endpoints_compatible
Лайков: 64 | Загрузок: 11
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.