inclusionAI/LLaDA2.0-flash - Каталог нейросетей
Генерация текста

inclusionAI/LLaDA2.0-flash

Добавлено:
inclusionAI/LLaDA2.0-flash

LLaDA2.0-flash — это модель диффузного языка с архитектурой 100BA6B Mixture-of-Experts (MoE). Являясь усовершенствованной, настроенной на инструкции версией серии LLaDA2.0, она оптимизирована для практического применения. + Ведущая архитектура MoE: модель распространения большого языка Mixture-of-Experts (MoE) с открытым исходным кодом постоянно обучается на серии Ling2.0 с примерно 20 триллионами токенов. + Эффективный вывод: при общем количестве 100 миллиардов параметров во время вывода активируются только 6,1 миллиарда. LLaDA2.0-flash значительно снижает вычислительные затраты, превосходя по производительности плотные модели аналогичного масштаба с открытым исходным кодом. + Впечатляющая производительность при написании кода и сложных рассуждениях: отлично справляется с такими задачами, как генерация кода и сложные математические рассуждения, демонстрируя сильные способности к рассуждению. + Использование инструментов: поддерживает вызов инструментов и обеспечивает превосходную производительность при выполнении сложных задач с использованием агентов. + Открытость и расширяемость: полностью открытый исходный код и приверженность прозрачности. В будущем мы планируем выпустить ведущую систему вывода и продолжать инвестировать в передовые области, такие как диффузионный LLM (dLLM), для стимулирования прорывных инноваций. + Усиленное мышление с помощью LLaDA 2.0: серия LLaDA 2.0…

Модальности:
Генерация текста

Области применения:
Диалог / чат


Задача: Генерация текста
Автор: inclusionAI
Теги: llada2_moe, dllm, diffusion, llm, text_generation, conversational, custom_code
Лайков: 67  |  Загрузок: 1,054

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.