XiaomiMiMo/MiMo-7B-Base - Каталог нейросетей
Генерация текста

XiaomiMiMo/MiMo-7B-Base

Добавлено:
XiaomiMiMo/MiMo-7B-Base

━━━━━━━━━━━━━━━━━━━━ ━━━━━━━━━━━━━━━━━━━━━ Раскрытие логического потенциала языковой модели: от предварительной подготовки к последующей тренировке ━━━━━━━━━━━━━━━━━━━━ ━━━━━━━━━━━━━━━━━━━━━ 🤗 Обнимающее лицо  | 🤖️ ModelScope  | 📔 Технический отчет | В настоящее время большинство успешных работ RL, включая исследования с открытым исходным кодом, опираются на относительно большие базовые модели, например, модели 32B, особенно для расширения возможностей рассуждения кода. Более того, широко распространено мнение, что достижение единообразных и одновременных улучшений как математических, так и программных возможностей в рамках небольшой модели является сложной задачей. Тем не менее, мы считаем, что эффективность модели рассуждения, обученной RL, зависит от внутреннего потенциала рассуждения, присущего базовой модели. Чтобы полностью раскрыть логический потенциал языковых моделей, усилия должны быть сосредоточены не только на пост-обучении, но и на стратегиях предварительного обучения, адаптированных к рассуждению. В этой работе мы представляем МиМо-7Б, серию моделей, обученных с нуля и созданных для задач рассуждения. Наши эксперименты RL на базе MiMo-7B показывают, что наша модель обладает исключительным потенциалом рассуждения, даже превосходя гораздо более крупные модели 32B. Кроме того, мы проводим обучение RL на холодном запуске…

Модальности:
Генерация текста

Области применения:
Диалог / чат


Задача: Генерация текста
Автор: XiaomiMiMo
Теги: mimo, conversational, custom_code
Лайков: 125  |  Загрузок: 121,413

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.