Модель представляет собой настроенную по инструкции версию rinna/nekomata-14b. Он принимает формат ввода Alpaca. 40-слойная языковая модель на основе преобразователя скрытого размера 5120. Подробности архитектуры см. в документе Qwen. Данные тонкой настройки представляют собой подмножество следующих наборов данных. Databricks Данные Dolly Японские Databricks Данные Dolly FLAN Инструкция Данные настройки и их японский перевод Izumi lab LLM Японский набор данных Следующие разделы используются alt aozora-txt CourseraParallel ParaNatCom Tab-delimitedBilingualSentencePairs tanaka-corpus wikinews wordnet yasashi-japanese Остальные разделы содержат часто используемые корпуса оценок, поэтому они пропускаются во избежание утечки данных. ~~~~python импортирует факел из трансформаторов import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.frompretrained(«rinna/nekomata-14b-instruction»,trustremote_code=True) model = AutoModelForCausalLM.frompretrained(«rinna/nekomata-14b-instruction», devicemap=»auto»,trustremotecode=True) инструкция = «次の日本語を英語に翻訳してください。» input = «大規模言語モデル(だいきぼげんごモデル、英: большой язык…
Модальности:
Генерация текста
Области применения:
Следование инструкциям
Задача: Генерация текста
Автор: rinna
Теги: qwen, custom_code, ja, en
Лайков: 23 | Загрузок: 24
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.