Этот репозиторий предоставляет японоориентированную многоязычную модель GPT-NeoX, состоящую из 10 миллиардов параметров. Модель обучалась с использованием кода на базе EleutherAI/gpt-neox. 36-слойная языковая модель на основе преобразователя с 4864 скрытыми размерами. Модель была обучена примерно на 600 миллиардах токенов из следующих корпусов. ~~~~python импортирует факел из трансформаторов import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.frompretrained(«matsuo-lab/weblab-10b») model = AutoModelForCausalLM.frompretrained(«matsuo-lab/weblab-10b», torch_dtype=torch.float16) text = «吾輩は猫である。» tokenids = tokenizer.encode(text, addspecialtokens=False, returntensors=»pt») с torch.nograd(): выходные данные = model.generate( tokenids.to(model.device), maxnewtokens=100, dosample=True, температура=0,7, top_p=0,95) вывод = tokenizer.decode(output_ids.tolist()[0]) print(выход)
Модальности:
Генерация текста
Задача: Генерация текста
Автор: matsuo-lab
Теги: gpt_neox, text-generation-inference, endpoints_compatible
Лайков: 65 | Загрузок: 807
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.