nebius/SWE-rebench-openhands-Qwen3-235B-A22B - Каталог нейросетей
Генерация текста

nebius/SWE-rebench-openhands-Qwen3-235B-A22B

Добавлено:
nebius/SWE-rebench-openhands-Qwen3-235B-A22B

SWE-rebench-openhands-Qwen3-235B-A22B — это контрольная точка тонкой настройки выборки отклонения 235B (RFT), полученная на основе Qwen/Qwen3-235B-A22B-Instruct-2507, обученная на недавно выпущенном наборе данных nebius/SWE-rebench-openhands-trajectories. Для обучения использовалась максимальная длина последовательности 131 тыс. токенов. Размер модели Максимальное количество оборотов = 100 Максимальное количество оборотов = 500 Проход @ 1 Проход @ 5 Проход @ 1 Проход @ 5 Проход @ 1 Проход @ 5 Проход @ 1 Проход @ 5 Масштаб 30B Qwen3-30B-A3B-Instruct-2507 30B 25,2 44,8 11,8 24,4 25,7 44,2 14,2 26,5 Qwen3-Coder-30B-A3B-Instruct 30B 51,9 67,3 28,7 42,8 50,0 63,0 28,1 38,7 nebius/SWE-rebench-openhands-Qwen3-30B-A3B (Наши) 30B 49,7(+24,5) 65,4(+20,6) 28,1(+16,3) 38,7(+14,3) 50,3(+24,6) 68,3(+24,1) 28,1(+13,9) 38,7(+12,2) 100Б+ шкала ГЛМ-4,5-Воздух 106Б 58,2 73,5 33,8 42,8 — — — — масштаб 200B+ Qwen3-235B-A22B-Instruct-2507 235B 45,2 65,9 29,3 44,8 46,2 67,5 25,3 40,8 nebius/SWE-rebench-openhands-Qwen3-235B-A22B (Наши) 235Б 59,9(+14,7) 73,9(+8,0) 35,1(+5,8) 46,9(+2,1) 61,7(+15,5) 74,3(+6,8) 34,2(+8,9) 44,8(+4,0) 300Б+ шкала GLM-4,5 355Б 64,4 76,2 33,8 44,8 — — — — Qwen3-Coder-480B-A35B-Instruct 480B 64,7 75,8 36,3 44,8 66,5 77,8 35,5 42,8 Таблица 1. Pass@1 (в среднем за 5…

Модальности:
Генерация текста

Области применения:
Генерация кода Диалог / чат


Задача: Генерация текста
Автор: nebius
Теги: qwen3_moe, code, agent, conversational, endpoints_compatible
Лайков: 8  |  Загрузок: 4

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.