Модель «комт-лама-2-7b» была разработана с использованием методики многозадачного обучения, направленной на улучшение навыков корейского языка. Для получения более подробной информации обратитесь к репозиторию GitHub. Разработчики моделей: davidkim(changyeon kim). Репозиторий: https://github.com/davidkim205/komt. Архитектура модели**: komt-llama-2-7b — это авторегрессионная языковая модель, использующая оптимизированную архитектуру преобразователя. В настроенных версиях используется контролируемая точная настройка с помощью многозадачной инструкции — используется lm-evaluation-harness от EleutherAI https://github.com/EleutherAI/lm-evaluation-harness/tree/polyglot. Результаты производительности каждой модели см. по ссылке GitHub ниже. https://github.com/davidkim205/komt/tree/main/eval_results Компания Meta разработала и выпустила семейство больших языковых моделей (LLM) Llama 2 — коллекцию предварительно обученных и точно настроенных генеративных текстовых моделей с масштабом от 7 до 70 миллиардов параметров. Наши доработанные LLM, называемые Llama-2-Chat, оптимизированы для сценариев использования диалога. Модели Llama-2-Chat превосходят модели чата с открытым исходным кодом по большинству протестированных нами тестов, а по нашим человеческим оценкам полезности и безопасности находятся на одном уровне с некоторыми популярными моделями с закрытым исходным кодом…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: davidkim205
Теги: llama, facebook, meta, llama-2, llama-2-chat, en, ko, text-generation-inference
Лайков: 7 | Загрузок: 7
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.