deepcogito/cogito-v2-preview-deepseek-671B-MoE - Каталог нейросетей
Генерация текста

deepcogito/cogito-v2-preview-deepseek-671B-MoE

Добавлено:
deepcogito/cogito-v2-preview-deepseek-671B-MoE

LLM Cogito v2 представляют собой генеративные модели, настроенные на инструкции. Все модели выпускаются по открытой лицензии для коммерческого использования. — Модели Cogito v2 — это гибридные модели рассуждения. Каждая модель может отвечать напрямую (стандартный LLM) или размышлять перед ответом (например, модели рассуждения). — LLM обучаются с использованием итеративной дистилляции и амплификации (IDA) – масштабируемой и эффективной стратегии согласования сверхинтеллекта с использованием итеративного самосовершенствования. — Модели оптимизированы для кодирования, STEM, выполнения инструкций и общей полезности и обладают значительно более высокими возможностями многоязычности, кодирования и вызова инструментов, чем аналоги эквивалентного размера. — Как в стандартном режиме, так и в режиме рассуждения модели Cogito v2-preview превосходят аналоги аналогичного размера по общим отраслевым тестам. — Эта модель обучена на более чем 30 языках и поддерживает длину контекста 128 КБ. Вот производительность модели в некоторых стандартных отраслевых тестах: — По умолчанию модель отвечает в стандартном режиме. — Чтобы включить мышление, вы можете использовать любой из двух методов: — Установите Enablethinking=True` при применении шаблона чата. — Добавить конкретную системную подсказку вместе с предварительным заполнением…

Модальности:
Генерация текста

Области применения:
Диалог / чат


Задача: Генерация текста
Автор: deepcogito
Теги: deepseek_v3, conversational, custom_code, text-generation-inference, endpoints_compatible
Лайков: 36  |  Загрузок: 11

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.