deepseek-ai/DeepSeek-V3.2-Speciale - Каталог нейросетей
Генерация текста

deepseek-ai/DeepSeek-V3.2-Speciale

Добавлено:
deepseek-ai/DeepSeek-V3.2-Speciale

Мы представляем DeepSeek-V3.2, модель, которая сочетает в себе высокую вычислительную эффективность с превосходными рассуждениями и производительностью агентов. Наш подход основан на трех ключевых технических достижениях: 1. DeepSeek Sparse Attention (DSA). Мы представляем DSA, эффективный механизм внимания, который существенно снижает сложность вычислений при сохранении производительности модели, специально оптимизированный для сценариев с длинным контекстом. 2. Масштабируемая платформа обучения с подкреплением. Благодаря внедрению надежного протокола RL и масштабированию вычислений после обучения DeepSeek-V3.2 работает сравнимо с GPT-5. Примечательно, что наш высокопроизводительный вариант DeepSeek-V3.2-Speciale превосходит GPT-5 и демонстрирует навыки рассуждения на уровне Gemini-3.0-Pro. — Достижения: 🥇Золотая медаль на Международной математической олимпиаде (IMO) и Международной олимпиаде по информатике (IOI) 2025 года. 3. Крупномасштабный конвейер синтеза агентских задач. Чтобы интегрировать рассуждения в сценарии использования инструментов, мы разработали новый конвейер синтеза, который систематически генерирует обучающие данные в большом масштабе. Это облегчает масштабируемое постобучение агентов, улучшая соответствие и обобщение в сложных интерактивных средах. Также мы выпустили…

Модальности:
Генерация текста


Задача: Генерация текста
Автор: deepseek-ai
Теги: deepseek_v32, endpoints_compatible, fp8
Лайков: 680  |  Загрузок: 153,822

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.