cahya/gpt2-small-indonesian-522M

Это небольшая модель GPT2, предварительно обученная с помощью индонезийской Википедии с использованием цели моделирования причинного языка (CLM). Эта модель не имеет корпуса: она не делает разницы между Индонезией и Индонезией. Это одна из нескольких других языковых моделей, предварительно обученных с использованием наборов данных на индонезийском языке. Более подробную информацию о ее использовании в последующих задачах (классификация текста, генерация текста и т. д.) можно найти на странице Модели индонезийского языка на основе Transformer. Эту модель можно использовать непосредственно с конвейером для генерации текста. Поскольку генерация основана на некоторой случайности, мы задаем начальное значение для воспроизводимости: Вот как использовать эту модель для получения характеристик заданного текста в PyTorch: Эта модель была предварительно обучена с использованием 522 МБ индонезийской Википедии. Тексты токенизированы с использованием байтовой версии кодирования пар байтов (BPE) (для символов Юникода) и размера словаря 52 000. Входные данные представляют собой последовательности из 128 последовательных токенов.

Модальности:
Генерация текста

Задача: Генерация текста
Автор: cahya
Теги: tf, jax, gpt2, id, text-generation-inference, endpoints_compatible
Лайков: 14 | Загрузок: 2,958

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

dnotitia/Llama-DNA-1.0-8B-Instruct

DNA 1.0 8B Instruct — это современная двуязычная языковая модель (SOTA), основанная на архитектуре Llama, специально оптимизированная для...

Генерация текста

a686d380/rwkv-5-h-world

首先在进入RWKV Runner的release界面 https://github.com/josStorer/RWKV-Runner/releases 点击 Файлы и версии, 再点击rwkv-5-h-world-1b5.pth Загрузите файл RWKV-Runnerwindowsx64.exe и загрузите модели rwkv-5-h-world-1b5.pth.如果你不知道该从何下手，可以尝试把喜欢的小说段落放在续写界面尝试，AI模型目前仍然不擅长超长的有逻辑的叙事，因此建议使用此模型用来描写短篇段落在精度上,int8会比fp16占用显存/内存更小，但是通常更慢。如果你的显卡过于陈旧以至于不支持fp16，请选择fp32。载入显存层数会调配显存和内存的占用,通常尽可能调大此参数使得显存占满。有关显存占用的估计: 1b5中的b指代的是миллиард, 十亿。所以1b5也就是十五亿。B Illion...

Генерация текста

bartowski/mlabonne_Qwen3-8B-abliterated-GGUF

Исходная модель: https://huggingface.co/mlabonne/Qwen3-8B-abliterated. Запускайте их напрямую с помощью llama.cpp или любого другого проекта на основе llama.cpp. Некоторые из...

Генерация текста

itsliupeng/openllama-7b-base

Воспроизведение OpenLLaMA с использованием 128 графических процессоров H100 в Bfloat16. Предварительные данные состоят из Falcon, Starcoder и Wikipedia,...