🤗 Hugging Face | 🚀Github | 📑 Paper | 📖 Английский | 📖 Китайский | 💻 Kaggle Notebook Kyara (Knowledge Yielding Adaptive Retrival Augmentation) — экспериментальный проект, направленный на улучшение языковых моделей посредством процессов поиска знаний. Целью проекта является повышение способности модели адаптировать знания и улучшить понимание языка, особенно таких недостаточно представленных языков, как традиционный китайский. Учитывая относительно ограниченную доступность данных по традиционному китайскому языку по сравнению с обширным корпусом английских данных, используемых для обучения моделей, Kyara устраняет этот пробел, расширяя ограниченный корпус для этого языка. Чтобы проверить эффективность Kyara, мы провели полную настройку параметров Gemma-2-2b-it, в результате чего появилась первая итерация модели Kyara. Результаты первоначальной оценки, подробно описанные в разделе «Бенчмарки», демонстрируют, что Kyara превосходит исходную Gemma-2-2b-it по различным тестам, при этом заметно улучшаются оценки китайского языка. Метод агрегирования групп в TMMLUPlus является макросредним, следуя практике официальной реализации. На данный момент Кьяра-2b-это…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: zake7749
Теги: gemma2, conversational, zh, en, model-index, text-generation-inference, endpoints_compatible
Лайков: 15 | Загрузок: 125
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.