Доработанная версия Qwen3-4B-Thinking-2507, специально оптимизированная для конкурентного программирования и задач анализа кода. Эта модель была обучена на высококачественном наборе данных Code-Reasoning, чтобы расширить ее возможности в решении сложных задач программирования с детальным рассуждением. Эта модель представляет собой версию Qwen3-4B-Thinking-2507 с точной настройкой LoRA со следующими характеристиками: — Базовая модель: Qwen3-4B-Thinking-2507 (параметры 4.0B) — Метод обучения: LoRA (адаптация низкого ранга) — Набор обучающих данных: GetSoloTech/Code-Reasoning — Платформа обучения: Unsloth с QLoRA — Длина контекста: 4096 токенов (настраивается до 262 144) — Тип модели: причинно-языковая модель с возможностями мышления — Расширенное рассуждение кода: специально обучено решению задач конкурентного программирования — Возможности мышления: наследует расширенные возможности рассуждения из базовой модели — Высококачественные решения: обучение на решениях с процентом прохождения тестовых примеров ≥50 % — Структурированный вывод: оптимизирован для создания обоснованных программных решений — Эффективное обучение: используются адаптеры LoRA для эффективного обновления параметров — Разделение: Python. — Источник: высококачественные задачи конкурентного программирования от TACO, APPS и…
Модальности:
Генерация текста
Области применения:
Генерация кода Программирование Диалог / чат
Языки программирования:
Python
Задача: Генерация текста
Автор: GetSoloTech
Теги: qwen3, code-generation, competitive-programming, code-reasoning, programming, algorithms, problem-solving, python
Лайков: 15 | Загрузок: 31
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.