Репозиторий GitHub | Технический отчет | Присоединяйтесь к нам 👋 Свяжитесь с нами в Discord и WeChat > [!NOTE] > ### 🏆 2026 Sparse Операторское ускорение и гонка (SOAR) уже в игре! > > «Архитектура MiniCPM-SALA — это только начало. Для полной реализации ее потенциала требуется глубокая синергия на уровне системы и оптимизация межуровневой компиляции». > > В сотрудничестве с SGLang и NVIDIA OpenBMB приглашает специалистов со всего мира расширить границы логического вывода в масштабе 9B и 1 млн токенов на NVIDIA 6000D. > > 💰 Призовой фонд: >100 000 долларов США (🥇 Главный приз: 89 000 долларов США) | 🚀 Задача: одиночная и многопакетная оптимизация > > 👉 Нажмите здесь, чтобы присоединиться к гонке @ soar.openbmb.cn — [2026.02.11] Выпущен MiniCPM-SALA! Это первая крупномасштабная гибридная модель, эффективно объединяющая разреженное и линейное внимание для моделирования контекста с использованием миллионов токенов. Вы можете найти технический отчет здесь.🔥🔥🔥 MiniCPM-SALA (разреженное внимание и линейное внимание) — это первая крупномасштабная гибридная модель, эффективно интегрирующая разреженное и линейное внимание для моделирования контекста с миллионами токенов. ✅ Инновационная гибридная архитектура: синергизирует 25% разреженного внимания (InfLLM-v2) для высокоточного моделирования длительного контекста с 75% линейного внимания (Lightning). Внимание) для глобальных…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: openbmb
Теги: minicpm_sala, conversational, custom_code, zh, en
Лайков: 488 | Загрузок: 5,808
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.