davidkim205/komt-llama2-7b-v1-ggml

В последнее время, благодаря успеху ChatGPT, появилось множество крупных языковых моделей в попытке догнать возможности ChatGPT. Однако, когда дело доходит до производительности на корейском языке, было замечено, что многим моделям по-прежнему сложно давать точные ответы или эффективно генерировать корейский текст. В этом исследовании эти проблемы решаются путем введения метода многозадачного обучения, который использует контролируемые наборы данных из различных задач для создания обучающих данных для моделей большого языка (LLM). Разработчики моделей: davidkim(changyeon kim). Репозиторий: https://github.com/davidkim205/komt. Квантовые методы: q40, q41, q50, q51, q2k, q3k, q3km, q3kl, q4k, q4ks, q4km, q5k, q5ks, q5km, q80, q4_0. Для объективной оценки модели мы Первоначально использовал lm-evaluation-harness от EleutherAI, но получил неудовлетворительные результаты. Следовательно, мы провели оценки с использованием ChatGPT, широко используемой модели, как описано в разделах «Самосогласование с обратным переводом инструкций» и «Три способа использования больших языковых моделей для оценки чата».

Модальности:
Генерация текста

Задача: Генерация текста
Автор: davidkim205
Теги: gguf, facebook, meta, llama, llama-2, llama-2-chat, en, ko
Лайков: 8 | Загрузок: 173

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

bartowski/Young-Children-Storyteller-Mistral-7B-GGUF

nvidia/Qwen3-Next-80B-A3B-Thinking-NVFP4

GetSoloTech/Qwen3-Code-Reasoning-4B-GGUF

deepseek-ai/deepseek-coder-1.3b-base