GetSoloTech/GPT-OSS-Code-Reasoning-20B

— Базовая модель: openai/gpt-oss-20b. — Цель: контролируемая точная настройка для конкурентного программирования и алгоритмического анализа. — Набор данных: nvidia/OpenCodeReasoning-2 (OCR-2), объединение разбиений Python и CPP. Каждый образец реконструирует исходный вопрос и использует генерацию набора данных r1 в качестве вспомогательного ответа. — Длина контекста: 4096 токенов. — Метод обучения: LoRA SFT через TRL SFTTrainer. — Назначение: создание решений Python/C++ и обоснование задач конкурентного программирования. — Вне области применения: критически важные для безопасности приложения. Может галлюцинировать или выдавать неправильный/неэффективный код. Эта модель обучалась в формате чата. Рекомендуемая структура: если вы предпочитаете простой текст, поместите текст задачи после краткой инструкции, но формат чата обычно дает лучшие результаты. Укажите усилие рассуждения в шаблоне applychat (поддерживаемые значения: «низкий», «средний» (по умолчанию) или «высокий»): — Стиль рассуждения: более низкая температура (0,2–0,5) для более четкого пошагового рассуждения. — Длина: используйте maxnewtokens 512–1024 для полных решений; короче для подсказок. Стоп-токены: если вам нужен только окончательный код, рассмотрите возможность постобработки выходных данных модели для извлечения последнего блока кода. Источник: nvidia/OpenCodeReasoning-2 с Python…

Модальности:
Генерация текста

Области применения:
Генерация кода Логика и рассуждение Диалог / чат

Языки программирования:
Python C++

Задача: Генерация текста
Автор: GetSoloTech
Теги: gpt_oss, code-reasoning, coding, reasoning, problem-solving, algorithms, python, c++
Лайков: 17 | Загрузок: 25

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

ReadyArt/The-Omega-Abomination-Gemma3-12B-v1.0

WisdomShell/CodeShell-7B-Chat

bartowski/Mistral-22B-v0.2-GGUF

Qwen/Qwen2.5-3B-Instruct-GGUF