llm-jp/llm-jp-3-172b-beta1

В этом репозитории представлены большие языковые модели, разработанные Центром исследований и разработок больших языковых моделей Национального института информатики. — факел>=2.3.0 — трансформеры>=4.40.1 — токенизаторы>=0.19.1 — ускорение>=0.29.3 — flash-attn>=2.5.8 — Тип модели: Языковая модель на основе трансформатора — Всего просмотренных токенов: 700B Токенизатор этой модели основан на байтовой резервной модели Huggingface/tokenizers Unigram. Словарные статьи были конвертированы из llm-jp-tokenizer v3.0. Пожалуйста, обратитесь к README.md llm-jp-tokenizer для получения подробной информации о процедуре создания словаря (чистое обучение SentencePiece не воспроизводит наш словарь). Модели были предварительно обучены с использованием смеси следующих наборов данных. Представленные здесь модели находятся на ранних стадиях наших исследований и разработок и не были настроены для обеспечения соответствия результатов человеческим намерениям и соображениям безопасности.

Модальности:
Генерация текста

Задача: Генерация текста
Автор: llm-jp
Теги: llama, en, ja, text-generation-inference
Лайков: 9 | Загрузок: 0

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.