Valdemardi/FuseO1-DeepSeekR1-QwQ-SkyT1-32B-Preview-AWQ

Эта квантованная модель была создана с использованием AutoAWQ версии 0.2.8 с quantconfig`: | 📑 Бумага | 🐱 Репозиторий GitHub | 🤗 Обнимающее лицо | 🌐 Блог | Фанци Ван, Лунгуан Чжун, Цзыи Ян, Вэйчжоу Шен, Синтин Хуан FuseO1-Preview — это наша первоначальная попытка улучшить возможности рассуждения System-II в моделях большого языка (LLM) с помощью инновационных методов объединения моделей. Используя наши передовые методологии слияния SCE, мы интегрируем несколько LLM с открытым исходным кодом, подобных o1, в единую модель. Наша цель — объединить различные знания и сильные стороны различных программ LLM по рассуждению в единую унифицированную модель с сильными способностями к рассуждению Системы II, особенно в областях математики, программирования и естественных наук. — Слияние длинных и длинных рассуждений. Этот подход включает в себя объединение моделей в рамках LLM, которые используют рассуждения с длинными CoT, с целью расширения возможностей рассуждений с длинными CoT. Полученный результат FuseAI/FuseO1-DeepSeekR1-QwQ-SkyT1-32B-Preview достигает точности Pass@1 74,0 на AIME24, демонстрируя значительные улучшения производительности по сравнению с OpenAI o1-preview (44,6) и OpenAI o1-mini (63,4), даже приближаясь к OpenAI o1 (79,2). — Слияние длинных и коротких рассуждений: этот подход…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: Valdemardi
Теги: qwen2, conversational, text-generation-inference, endpoints_compatible, 4-bit, awq
Лайков: 8 | Загрузок: 2

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

NeverSleep/Noromaid-13B-0.4-DPO

Envoid/BondBurger-8x7B

AI-Sweden-Models/gpt-sw3-6.7b-v2-translator

ddobokki/Llama-2-70b-orca-200k