ud83dudcda Бумага (Обнимающее лицо) | ud83dudcda Бумага (arXiv) | ud83cudf10 Страница проекта | ud83dudcbb Репозиторий GitHub Hermes 4 14B — это передовая модель рассуждения в гибридном режиме, основанная на Qwen 3 14B от Nous Research, которая подойдет вам. Общайтесь с Гермесом в Nous Chat: https://chat.nousresearch.com Основные моменты обучения включают новый синтезированный корпус после обучения, в котором особое внимание уделяется проверенным следам рассуждений, значительным улучшениям в математике, коде, STEM, логике, творчестве и соответствию формату результатов, сохраняя при этом общее качество помощника и в целом нейтральное соответствие. — Корпус после обучения: значительно увеличен размер набора данных с 1 миллиона выборок и 1,2 миллиарда токенов до ~ 5 миллионов выборок / ~ 60 миллиардов токенов, смешанных между логическими и необоснованными данными. — Гибридный режим рассуждения с явными… сегментами, когда модель решает обдумать, и опциями, позволяющими ускорить ваши ответы, когда вы захотите. — Высококачественные, выразительные рассуждения улучшают математику, программирование, STEM, логику и даже творческое письмо и субъективные ответы. — Соблюдение схемы и структурированные выходные данные: обучены создавать действительный JSON для заданных схем и исправлять искаженные объекты. — Гораздо проще управлять и выравнивать: значительные улучшения в…
Модальности:
Генерация текста
Области применения:
Логика и рассуждение Следование инструкциям Диалог / чат
Задача: Генерация текста
Автор: NousResearch
Теги: qwen3, Qwen-3-14B, instruct, finetune, reasoning, hybrid-mode, chatml, function calling
Лайков: 121 | Загрузок: 3,374
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.