!image/png !image/png !image/png !image/png !image/png !image/png Это прямое обновление по сравнению с cat 70B, с удвоенным размером набора данных (2 ГБ-> 5 ГБ), добавленной поддержкой китайского языка с качеством, не уступающим исходному английскому набору данных. Медицинская часть набора данных COT спонсировалась Steelskull, а игровая часть с динамичными персонажами была предоставлена Gryphe’s (набор данных Aesir). Обратите внимание, что 8b основан на llama3 с ограниченной поддержкой Китая из-за выбора базовой модели. Формат чата в 8б — llama3. Модель 72b имеет более полную поддержку китайского языка и формат будет чатмл. Помимо указанных выше укреплений, процесс генерации данных во многом аналогичен. За исключением добавленных вступительных экзаменов на степень доктора философии по китайскому языку, данных по традиционному китайскому языку и китайским рассказам. В процессе аннотации приняли участие 20 постдоков (10 китайских и 10 англоговорящих врачей, специализирующихся в области вычислительной биологии, биомедицины, биофизики и биохимии). На вопросы GRE и MCAT/Kaoyan участники отвечали вручную, используя строго COT, а судьи BERT, производящие встраивания, обучались на основе предоставленной аннотации. Пример визуализации и оценки внедрения BERT см. в разделе…
Модальности:
Генерация текста
Области применения:
Диалог / чат Следование инструкциям
Задача: Генерация текста
Автор: turboderp
Теги: llama, conversational, text-generation-inference, endpoints_compatible
Лайков: 34 | Загрузок: 8
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.