pfnet/plamo-13b - Каталог нейросетей
Генерация текста

pfnet/plamo-13b

Добавлено:
pfnet/plamo-13b

PLaMo-13B — это модель 13B на основе LLaMA, предварительно обученная на английских и японских открытых наборах данных, разработанная Preferred Networks, Inc. PLaMo-13B выпускается под лицензией Apache v2.0. — Размер модели: 13B — Обученные токены: 1,5T токенов (английский: токены 1,32T, японский: токены 0,18T) — Длина контекста: 4096 — Разработчик: Preferred Networks, Inc — Тип модели: только причинный декодер — Язык(и): английский, японский — Лицензия: Apache v2.0 — C4 — английский — Project Gutenberg — RedPajama — Arxiv — RedPajama – CommonCrawl – English – RedPajama – Github – RedPajama – StackExchange – RedPajama – Wikipedia PLaMo-13B использует токенизатор фрагментов предложений, который обучается на подмножестве наборов данных для предварительного обучения модели. PLaMo-13B — это новая технология, использование которой сопряжено с риском. Тестирование, проведенное на сегодняшний день, проводилось на английском и японском языках и не охватило и не могло охватить все сценарии. По этим причинам, как и в случае со всеми LLM, потенциальные результаты PLaMo-13B невозможно предсказать заранее, и в некоторых случаях модель может давать неточные, предвзятые или другие нежелательные ответы на запросы пользователя. Поэтому, прежде чем развертывать какие-либо приложения ПЛАМо-13Б, разработчикам следует провести тестирование и настройку безопасности…

Модальности:
Генерация текста


Задача: Генерация текста
Автор: pfnet
Теги: plamo, custom_code, en, ja
Лайков: 86  |  Загрузок: 228

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.