zake7749/gemma-2-2b-it-chinese-kyara-dpo - Каталог нейросетей
Генерация текста

zake7749/gemma-2-2b-it-chinese-kyara-dpo

Добавлено:
zake7749/gemma-2-2b-it-chinese-kyara-dpo

🤗 Hugging Face  | 🚀Github  |  📑 Paper  |  📖 Английский  |  📖 Китайский  |  💻 Kaggle Notebook Kyara (Knowledge Yielding Adaptive Retrival Augmentation) — экспериментальный проект, направленный на улучшение языковых моделей посредством процессов поиска знаний. Целью проекта является повышение способности модели адаптировать знания и улучшить понимание языка, особенно таких недостаточно представленных языков, как традиционный китайский. Учитывая относительно ограниченную доступность данных по традиционному китайскому языку по сравнению с обширным корпусом английских данных, используемых для обучения моделей, Kyara устраняет этот пробел, расширяя ограниченный корпус для этого языка. Чтобы проверить эффективность Kyara, мы провели полную настройку параметров Gemma-2-2b-it, в результате чего появилась первая итерация модели Kyara. Результаты первоначальной оценки, подробно описанные в разделе «Бенчмарки», демонстрируют, что Kyara превосходит исходную Gemma-2-2b-it по различным тестам, при этом заметно улучшаются оценки китайского языка. Метод агрегирования групп в TMMLUPlus является макросредним, следуя практике официальной реализации. На данный момент Кьяра-2b-это…

Модальности:
Генерация текста

Области применения:
Диалог / чат


Задача: Генерация текста
Автор: zake7749
Теги: gemma2, conversational, zh, en, model-index, text-generation-inference, endpoints_compatible
Лайков: 15  |  Загрузок: 125

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.