zake7749/gemma-2-2b-it-chinese-kyara-dpo

🤗 Hugging Face ｜ 🚀Github ｜ 📑 Paper ｜ 📖 Английский ｜ 📖 Китайский ｜ 💻 Kaggle Notebook Kyara (Knowledge Yielding Adaptive Retrival Augmentation) — экспериментальный проект, направленный на улучшение языковых моделей посредством процессов поиска знаний. Целью проекта является повышение способности модели адаптировать знания и улучшить понимание языка, особенно таких недостаточно представленных языков, как традиционный китайский. Учитывая относительно ограниченную доступность данных по традиционному китайскому языку по сравнению с обширным корпусом английских данных, используемых для обучения моделей, Kyara устраняет этот пробел, расширяя ограниченный корпус для этого языка. Чтобы проверить эффективность Kyara, мы провели полную настройку параметров Gemma-2-2b-it, в результате чего появилась первая итерация модели Kyara. Результаты первоначальной оценки, подробно описанные в разделе «Бенчмарки», демонстрируют, что Kyara превосходит исходную Gemma-2-2b-it по различным тестам, при этом заметно улучшаются оценки китайского языка. Метод агрегирования групп в TMMLUPlus является макросредним, следуя практике официальной реализации. На данный момент Кьяра-2b-это…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: zake7749
Теги: gemma2, conversational, zh, en, model-index, text-generation-inference, endpoints_compatible
Лайков: 15 | Загрузок: 125

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

nvidia/Llama-3.1-8B-Instruct-FP8

BAAI/Infinity-Instruct-7M-Gen-Llama3_1-70B

DUTIR-BioNLP/Taiyi-LLM

jondurbin/airoboros-l2-13b-2.1