Jackrong/Qwen3.5-9B-Neo

> Обновление Neo: > Эта итерация в значительной степени ориентирована на достижение значительного улучшения в рассуждениях и математических результатах при сохранении конкурентоспособной общей точности. > > Neo представляет высокооптимизированную систему рассуждений, предназначенную для устранения избыточных внутренних циклов и циклических рассуждений. В отличие от стандартных моделей, которые просто думают дольше, когда сталкиваются с трудными задачами, Neo создан для того, чтобы думать умнее, а не дольше. Оцененный в пакете лидеров LM Evaluation Harness, он обеспечивает заметные улучшения в BBH (+0,87 п.п.), MATH Hard (+0,98 п.п.) и MUSR (+2,91 п.п.) — тестах, которые наиболее непосредственно исследуют структурированное многоэтапное рассуждение и логический вывод. Jackrong/Qwen3.5-9B-Neo — это усовершенствованная версия модели Qwen3.5-9B, ориентированная на рассуждения. Его основная цель — улучшить качество формирования цепочки мыслей, уделяя особое внимание более сложным рассуждениям и математическим задачам, сохраняя при этом широкую конкурентоспособность по общим академическим критериям. Цель этой модели Neo — не просто заставить модель «думать больше», но и помочь ей мыслить более структурировано: устранить ненужный многословный чрезмерный анализ, закрепить промежуточные шаги и улучшить многошаговую логику…

Модальности:
Генерация текста

Области применения:
Логика и рассуждение Диалог / чат

Задача: Генерация текста
Автор: Jackrong
Теги: qwen3_5, unsloth, qwen, qwen3.5, reasoning, chain-of-thought, lora, competitive-programming
Лайков: 15 | Загрузок: 318

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

TheBloke/Xwin-LM-7B-V0.1-GPTQ

VAGOsolutions/SauerkrautLM-Phi-3-medium

capleaf/T-Llama

aifeifei798/Qwen3.5-Queen-27B