inclusionAI/LLaDA2.1-mini

LLaDA2.1-mini — это модель диффузного языка серии LLaDA с улучшенными возможностями редактирования. Это значительно повышает скорость вывода, обеспечивая при этом высокую производительность задач. + Редактируемый файл с коррекцией ошибок: Структурные инновации в генерации редактируемых данных для dLLM + Режим «Скорость» и «Качество»: мини-модель 16B обеспечивает сверхбыстрый вывод в режиме «Скорость», оставаясь при этом конкурентоспособной при выполнении различных задач и в режиме «Качество». + Обучение с подкреплением на dLLM в масштабе 100B: адаптированный алгоритм и структура, обеспечивающие обучение с подкреплением для больших dLLM. + Мощные возможности использования агентов/инструментов с LLaDA: следующее обновление будет оснащено мощными возможностями использования агентов и инструментов на больших расстояниях. + Экстремальное редактирование: в следующем обновлении будут представлены более сильные и обширные возможности редактирования, направленные на исправление большего количества ошибок в параллельных рассуждениях. + Изучите больше парадигм обучения: мы хотим изучить больше парадигм обучения, чем SFT и RL для dLLM. Убедитесь, что у вас установлены трансформаторы и их зависимости: Для достижения оптимальной производительности мы рекомендуем следующие настройки: 1. Параметры выборки: Мы рекомендуем следующие общие параметры выборки: длина блока = 32, температура = 0,0,…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: inclusionAI
Теги: llada2_moe, dllm, diffusion, llm, text_generation, conversational, custom_code
Лайков: 99 | Загрузок: 38,528

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

deepseek-ai/deepseek-llm-67b-base

Qwen/Qwen3-235B-A22B-GGUF

PJMixers-Archive/LLaMa-1-MedicWizard-7B

icefog72/IceAbsintheRP-7b