— 32B модель рассуждения, обученная и обслуживаемая при 4-битном квантовании — Конкуренция с GPT-4o / Claude 3.5 Sonnet по тестам рассуждения и кодирования — Длина контекста 65 тыс. для рассуждений в длинных документах — Открытый исходный код (Apache 2.0) — полностью разрешен для коммерческого использования — Доступно через Ollama, Hugging Face и размещенный API с 5 миллионами бесплатных токенов Alpie Core — одна из первых точно настроенные 4-битные модели рассуждения из Индии и одни из первых в мире такого масштаба. Обученный всего на 8 графических процессорах Hopper с использованием 4-битного квантования LoRA и QLoRA с синтетическими наборами данных STEM, он доказывает, что агрессивное квантование может соответствовать базовым уровням полной точности и даже превосходить их. Благодаря значительно уменьшенному объему памяти Alpie Core обеспечивает конкурентоспособную производительность рассуждений на передовом уровне, превосходя даже лучшие патентованные модели. Он достигает: — 81,28% при MMLU (5-кадровый) — 92,75% при GSM8K (8-кадровый) — 57,8% при проверке SWE-Bench Это демонстрирует, что эффективные модели могут конкурировать с передовыми системами, оставаясь при этом практичными для масштабного развертывания в реальных условиях. Alpie Core подвергся обширной контролируемой точной настройке (SFT) для усиления логики, надежности и безопасности. В обучении использовалось разнообразное сочетание тщательно отобранных материалов с открытым исходным кодом…
Модальности:
Генерация текста
Области применения:
Генерация кода Математика Логика и рассуждение Диалог / чат
Задача: Генерация текста
Автор: 169Pi
Теги: qwen2, reasoning, coding, mathematics, quantization, 4-bit model, state-of-the-art, conversational
Лайков: 7 | Загрузок: 24
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.