MiniMaxAI/SynLogic-7B

🐙 Репозиторий GitHub: https://github.com/MiniMax-AI/SynLogic 📜 Бумага (arXiv): https://arxiv.org/abs/2505.19641 🤗 Набор данных:** SynLogic on Hugging Face SynLogic-7B — это модель логического рассуждения, построенная на Qwen2.5-7B-Base и обученная с использованием обучения с подкреплением на нашем SynLogic. набор данных. Несмотря на меньший размер, модель демонстрирует сильные возможности логического рассуждения и эффективное обобщение на математические области. Комплексное логическое рассуждение: обучение выполнению 27 разнообразных задач на логическое рассуждение (адаптированных для шкалы 7B), включая судоку, игру 24, шифр и т. д. Поддающееся проверке обучение: все данные обучения могут быть автоматически проверены, что обеспечивает эффективное обучение с подкреплением. Сильное обобщение: переносит навыки логического рассуждения в решение математических задач без явного математического обучения. Эффективная шкала: достигает высоких результатов с более компактной моделью параметров 7B. Основные достижения: улучшение на +9,5 баллов. над Qwen2.5-7B-Instruct на KOR-Bench — Сильное математическое обобщение с 10,0% по AIME 2024 (против 6,3% для модели инструкций) — Эффективное обучение логическому мышлению, несмотря на меньший размер модели. Базовая модель: Qwen2.5-7B-Базовый алгоритм обучения: GRPO (групповая относительная…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: MiniMaxAI
Теги: qwen2, LLM, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 25 | Загрузок: 244

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

huihui-ai/Huihui-MiroThinker-v1.5-30B-abliterated

beberik/Nyxene-v2-11B

fblgit/una-cybertron-7b-v3-OMA

NeverSleep/Noromaid-7B-0.4-DPO