В последнее время, благодаря успеху ChatGPT, появилось множество крупных языковых моделей в попытке догнать возможности ChatGPT. Однако, когда дело доходит до производительности на корейском языке, было замечено, что многим моделям по-прежнему сложно давать точные ответы или эффективно генерировать корейский текст. В этом исследовании эти проблемы решаются путем введения метода многозадачного обучения, который использует контролируемые наборы данных из различных задач для создания обучающих данных для моделей большого языка (LLM). Разработчики моделей: davidkim(changyeon kim). Репозиторий: https://github.com/davidkim205/komt. Квантовые методы: q40, q41, q50, q51, q2k, q3k, q3km, q3kl, q4k, q4ks, q4km, q5k, q5ks, q5km, q80, q4_0. Для объективной оценки модели мы Первоначально использовал lm-evaluation-harness от EleutherAI, но получил неудовлетворительные результаты. Следовательно, мы провели оценки с использованием ChatGPT, широко используемой модели, как описано в разделах «Самосогласование с обратным переводом инструкций» и «Три способа использования больших языковых моделей для оценки чата».
Модальности:
Генерация текста
Задача: Генерация текста
Автор: davidkim205
Теги: gguf, facebook, meta, llama, llama-2, llama-2-chat, en, ko
Лайков: 8 | Загрузок: 173
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.