inclusionAI/LLaDA2.0-flash

LLaDA2.0-flash — это модель диффузного языка с архитектурой 100BA6B Mixture-of-Experts (MoE). Являясь усовершенствованной, настроенной на инструкции версией серии LLaDA2.0, она оптимизирована для практического применения. + Ведущая архитектура MoE: модель распространения большого языка Mixture-of-Experts (MoE) с открытым исходным кодом постоянно обучается на серии Ling2.0 с примерно 20 триллионами токенов. + Эффективный вывод: при общем количестве 100 миллиардов параметров во время вывода активируются только 6,1 миллиарда. LLaDA2.0-flash значительно снижает вычислительные затраты, превосходя по производительности плотные модели аналогичного масштаба с открытым исходным кодом. + Впечатляющая производительность при написании кода и сложных рассуждениях: отлично справляется с такими задачами, как генерация кода и сложные математические рассуждения, демонстрируя сильные способности к рассуждению. + Использование инструментов: поддерживает вызов инструментов и обеспечивает превосходную производительность при выполнении сложных задач с использованием агентов. + Открытость и расширяемость: полностью открытый исходный код и приверженность прозрачности. В будущем мы планируем выпустить ведущую систему вывода и продолжать инвестировать в передовые области, такие как диффузионный LLM (dLLM), для стимулирования прорывных инноваций. + Усиленное мышление с помощью LLaDA 2.0: серия LLaDA 2.0…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: inclusionAI
Теги: llada2_moe, dllm, diffusion, llm, text_generation, conversational, custom_code
Лайков: 67 | Загрузок: 1,054

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

eugenepentland/WizardLM-7B-Landmark

RedHatAI/Llama-3.1-Nemotron-70B-Instruct-HF-FP8-dynamic

ubergarm/Hunyuan-A13B-Instruct-GGUF

ahxt/llama2_xs_460M_experimental