— Базовая модель: openai/gpt-oss-20b. — Цель: контролируемая точная настройка для конкурентного программирования и алгоритмического анализа. — Набор данных: nvidia/OpenCodeReasoning-2 (OCR-2), объединение разбиений Python и CPP. Каждый образец реконструирует исходный вопрос и использует генерацию набора данных r1 в качестве вспомогательного ответа. — Длина контекста: 4096 токенов. — Метод обучения: LoRA SFT через TRL SFTTrainer. — Назначение: создание решений Python/C++ и обоснование задач конкурентного программирования. — Вне области применения: критически важные для безопасности приложения. Может галлюцинировать или выдавать неправильный/неэффективный код. Эта модель обучалась в формате чата. Рекомендуемая структура: если вы предпочитаете простой текст, поместите текст задачи после краткой инструкции, но формат чата обычно дает лучшие результаты. Укажите усилие рассуждения в шаблоне applychat (поддерживаемые значения: «низкий», «средний» (по умолчанию) или «высокий»): — Стиль рассуждения: более низкая температура (0,2–0,5) для более четкого пошагового рассуждения. — Длина: используйте maxnewtokens 512–1024 для полных решений; короче для подсказок. Стоп-токены: если вам нужен только окончательный код, рассмотрите возможность постобработки выходных данных модели для извлечения последнего блока кода. Источник: nvidia/OpenCodeReasoning-2 с Python…
Модальности:
Генерация текста
Области применения:
Генерация кода Логика и рассуждение Диалог / чат
Языки программирования:
Python C++
Задача: Генерация текста
Автор: GetSoloTech
Теги: gpt_oss, code-reasoning, coding, reasoning, problem-solving, algorithms, python, c++
Лайков: 17 | Загрузок: 25
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.