matsuo-lab/weblab-10b-instruction-sft

Этот репозиторий предоставляет японоориентированную многоязычную модель GPT-NeoX, состоящую из 10 миллиардов параметров. Модель обучалась с использованием кода на базе EleutherAI/gpt-neox. 36-слойная языковая модель на основе преобразователя с 4864 скрытыми размерами. Модель была обучена примерно на 600 миллиардах токенов из следующих корпусов. Модель была точно настроена на подмножестве записей из смеси следующего набора данных. Эпоха обучения: 1. — Альпака (английский) — Альпака (перевод на японский) — Flan 2021 (английский) — Flan CoT (английский) — Flan Dialog (английский) ~~~~python import torch from Transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.frompretrained(«matsuo-lab/weblab-10b-instruction-sft») модель = AutoModelForCausalLM.frompretrained(«matsuo-lab/weblab-10b-instruction-sft», torch_dtype=torch.float16) text = «大規模言語モデルについて説明してください。» text = f’以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。nn### Пример:n{text}nn### 応答:’ tokenids = tokenizer.encode(text, addspecialtokens=False, returntensors=»pt») с torch.nograd(): outputids = model.generate( tokenids.to(model.device), maxnewtokens=100, dosample=True, температура=0.7, top_p=0.95 ) вывод = tokenizer.decode(output_ids.tolist()[0]) print(выход)

Модальности:
Генерация текста

Области применения:
Следование инструкциям

Задача: Генерация текста
Автор: matsuo-lab
Теги: gpt_neox, text-generation-inference, endpoints_compatible
Лайков: 74 | Загрузок: 828

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

jspr/llama3-wordcel

Delta-Vector/MS3.2-Austral-Winton

or4cl3ai/SquanchNastyAI

trillionlabs/Trillion-7B-preview