jdopensource/JoyAI-LLM-Flash-Base

JoyAI-LLM Flash-Base — это современная языковая модель смешанных экспертов (MoE) с 3 миллиардами активированных параметров и 48 миллиардами общих параметров. Обученная с помощью оптимизатора Muon, база JoyAI Flash-base обеспечивает исключительную производительность при выполнении передовых задач по знанию, рассуждению и кодированию, будучи при этом тщательно оптимизированной для агентских возможностей. Серия JoyAI-LLM Flash направлена на ускорение высокопроизводительных приложений, чувствительных к задержкам, где стоимость запроса должна оставаться минимальной. — Сотрудничество по обучению и выводу: применение мюонного оптимизатора с плотным MTP, разработка новых методов оптимизации для устранения нестабильностей при масштабировании, обеспечивающих пропускную способность в 1,3–1,7 раза выше, чем у версии без MTP. — Агентский интеллект: специально разработан для использования инструментов, рассуждений и автономного решения проблем. GSM8K 88,78 90,37 MATH 78,16 59,60 MATH 500 77,00 58,00 И репозиторий кода, и веса моделей выпускаются по модифицированной лицензии MIT.

Модальности:
Генерация текста

Задача: Генерация текста
Автор: jdopensource
Теги: joyai_llm_flash, custom_code, zh, en
Лайков: 23 | Загрузок: 32

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

maywell/miqu-evil-dpo

lightblue/japanese-mpt-7b

Endevor/EndlessRP-v3-7B

beberik/Nyxene-v3-11B