openbmb/MiniCPM3-4B - Каталог нейросетей
Генерация текста

openbmb/MiniCPM3-4B

Добавлено:
openbmb/MiniCPM3-4B

Репозиторий MiniCPM | Бумага MiniCPM | Репозиторий MiniCPM-V | Присоединяйтесь к нам в Discord и WeChat MiniCPM3-4B — это третье поколение серии MiniCPM. Общая производительность MiniCPM3-4B превосходит Phi-3.5-mini-Instruct и GPT-3.5-Turbo-0125 и сравнима со многими последними моделями 7B ~ 9B. По сравнению с MiniCPM1.0/MiniCPM2.0, MiniCPM3-4B обладает более мощным и универсальным набором навыков, обеспечивающим более широкое использование. MiniCPM3-4B поддерживает вызов функций, а также интерпретатор кода. Инструкции по использованию см. в разделе «Дополнительные функции». MiniCPM3-4B имеет контекстное окно размером 32 КБ. MiniCPM3-4B, оснащенный LLMxMapReduce, теоретически может обрабатывать бесконечный контекст, не требуя огромного объема памяти. Тест Qwen2-7B-Instruct GLM-4-9B-Chat Gemma2-9B-it Llama3.1-8B-Instruct GPT-3.5-Turbo-0125 Phi-3.5-mini-Instruct(3.8B) MiniCPM3-4B Английский MMLU 70,5 72,4 72,6 69,4 69,2 68,4 67,2 BBH 64,9 76,3 65,2 67,8 70,3 68,6 70,2 MT-Bench 8,41 8,35 7,88 8,28 8,17 8,60 8,41 IFEVAL (быстрое строгое соответствие) 51,0 64,5 71,9 71,5 58,8 49,4 68,4 Китайский CMMLU 80,9 71,5 59,5 55,8 54,5 46,9 73,3 CEVAL 77,2 75,6 56,7 55,2 52,8 46,1 73,6 AlignBench v1.1 7,10 6,61 7,10 5,68 5,82 5,73 6,74 FollowBench-ж (ССР)…

Модальности:
Генерация текста

Области применения:
Диалог / чат


Задача: Генерация текста
Автор: openbmb
Теги: minicpm3, conversational, custom_code, zh, en
Лайков: 419  |  Загрузок: 11,058

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.