Большая модель GPT2 (762М параметров), обученная с нуля на голландском языке, с недоумением 15.1 на очищенном голландском mC4. Вы можете использовать эту модель GPT2 напрямую с конвейером для генерации текста. «Het eiland West-» — «Terschelling wordt sinds jaar en dag bebeon the Door de Mens. De mensen die in het huidige Terhernewanen doen er alles aan om hun dorp te behouden voor deze diersoort, namelijk; een natuurreservaat dat vooral bestaat uit hoge duinen met lage» begroeing waar planten van vroeger worden afgewisseld (zoals wilde hyacinten)en waarop Grassen Groeien waarvan sommige soorten zeldzame vormen hebben ontwikkeld: duinlelie of blauwe bosbes zijn bijvoorbeeld bekend vanwege onder andere kleurmole» * Токенизатор BPE, обученный на царапина для голландского языка на mC4 nl, очищенная с помощью скриптов из примеров Huggingface Transformers Flax. Эта модель была обучена на полной конфигурации (33B токенов) очищенного голландского mC4, который является оригинальным mC4, за исключением документов, содержащих слова из избранного голландского и английского списка грязных нецензурных и других плохих слов. Предложения, содержащие менее 3 слов, удаляются. Предложения со словом длиной более 1000 символов удаляются. Документы…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: yhavinga
Теги: jax, tensorboard, gpt2, gpt2-large, nl, text-generation-inference, endpoints_compatible
Лайков: 9 | Загрузок: 1,852
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.