GetSoloTech/Qwen3-Code-Reasoning-4B

Доработанная версия Qwen3-4B-Thinking-2507, специально оптимизированная для конкурентного программирования и задач анализа кода. Эта модель была обучена на высококачественном наборе данных Code-Reasoning, чтобы расширить ее возможности в решении сложных задач программирования с детальным рассуждением. Эта модель представляет собой версию Qwen3-4B-Thinking-2507 с точной настройкой LoRA со следующими характеристиками: — Базовая модель: Qwen3-4B-Thinking-2507 (параметры 4.0B) — Метод обучения: LoRA (адаптация низкого ранга) — Набор обучающих данных: GetSoloTech/Code-Reasoning — Платформа обучения: Unsloth с QLoRA — Длина контекста: 4096 токенов (настраивается до 262 144) — Тип модели: причинно-языковая модель с возможностями мышления — Расширенное рассуждение кода: специально обучено решению задач конкурентного программирования — Возможности мышления: наследует расширенные возможности рассуждения из базовой модели — Высококачественные решения: обучение на решениях с процентом прохождения тестовых примеров ≥50 % — Структурированный вывод: оптимизирован для создания обоснованных программных решений — Эффективное обучение: используются адаптеры LoRA для эффективного обновления параметров — Разделение: Python. — Источник: высококачественные задачи конкурентного программирования от TACO, APPS и…

Модальности:
Генерация текста

Области применения:
Генерация кода Программирование Диалог / чат

Языки программирования:
Python

Задача: Генерация текста
Автор: GetSoloTech
Теги: qwen3, code-generation, competitive-programming, code-reasoning, programming, algorithms, problem-solving, python
Лайков: 15 | Загрузок: 31

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

mtgv/MobileVLM-1.7B

DreamFast/gemma-3-12b-it-heretic

failspy/Llama-3-70B-Instruct-abliterated-v3

meta-math/MetaMath-70B-V1.0