Эта квантованная модель была создана с использованием AutoAWQ версии 0.2.8 с quantconfig`: | 📑 Бумага | 🐱 Репозиторий GitHub | 🤗 Обнимающее лицо | 🌐 Блог | Фанци Ван, Лунгуан Чжун, Цзыи Ян, Вэйчжоу Шен, Синтин Хуан FuseO1-Preview — это наша первоначальная попытка улучшить возможности рассуждения System-II в моделях большого языка (LLM) с помощью инновационных методов объединения моделей. Используя наши передовые методологии слияния SCE, мы интегрируем несколько LLM с открытым исходным кодом, подобных o1, в единую модель. Наша цель — объединить различные знания и сильные стороны различных программ LLM по рассуждению в единую унифицированную модель с сильными способностями к рассуждению Системы II, особенно в областях математики, программирования и естественных наук. — Слияние длинных и длинных рассуждений. Этот подход включает в себя объединение моделей в рамках LLM, которые используют рассуждения с длинными CoT, с целью расширения возможностей рассуждений с длинными CoT. Полученный результат FuseAI/FuseO1-DeepSeekR1-QwQ-SkyT1-32B-Preview достигает точности Pass@1 74,0 на AIME24, демонстрируя значительные улучшения производительности по сравнению с OpenAI o1-preview (44,6) и OpenAI o1-mini (63,4), даже приближаясь к OpenAI o1 (79,2). — Слияние длинных и коротких рассуждений: этот подход…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: Valdemardi
Теги: qwen2, conversational, text-generation-inference, endpoints_compatible, 4-bit, awq
Лайков: 8 | Загрузок: 2
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.