VulnLLM-R — это первая специализированная модель большого языка рассуждений, разработанная специально для обнаружения уязвимостей программного обеспечения. В отличие от традиционных инструментов статического анализа (таких как CodeQL) или небольших LLM, которые полагаются на простое сопоставление с образцом, VulnLLM-R обучен шаг за шагом рассуждать о потоке данных, потоке управления и контексте безопасности. Он имитирует мыслительный процесс аудитора службы безопасности человека и позволяет с высокой точностью выявлять сложные логические уязвимости. Документ: arXiv:2512.07533 Код и данные: Демонстрация GitHub:** Веб-демонстрация Обнаружение на основе рассуждений: не просто классифицирует код; он генерирует «цепочку мыслей» для анализа причин существования уязвимости. Превосходная точность: превосходит коммерческие гиганты (такие как Claude-3.7-Sonnet, o3-mini) и инструменты отраслевых стандартов (CodeQL, AFL++) по ключевым критериям. Эффективность: производительность SOTA достигается всего за 7B параметров, что делает его в 30 раз меньше и значительно быстрее, чем модели рассуждения общего назначения. Широкий охват: обучение и тестирование на C, C++, Python и Java (обобщение с нулевым выстрелом). VulnLLM-R-7B достигает самых современных результатов в таких тестах, как PrimeVul, Juliet 1.3 и ARVO. (Обратитесь к рисунку 1 и таблице 4 в статье, чтобы…
Модальности:
Генерация текста
Области применения:
Генерация кода Логика и рассуждение Диалог / чат
Задача: Генерация текста
Автор: UCSB-SURFI
Теги: qwen2, security, vulnerability-detection, code-analysis, reasoning, llm, conversational, en
Лайков: 177 | Загрузок: 46,675
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.