RedHatAI/DeepSeek-Coder-V2-Lite-Instruct-FP8

— Архитектура модели: DeepSeek-Coder-V2-Lite-Instruct — Входные данные: текст — Выходные данные: текст — Оптимизация модели: — Весовое квантование: FP8 — Активационное квантование: FP8 — Варианты предполагаемого использования: Предназначено для коммерческого и исследовательского использования на английском языке. Как и Meta-Llama-3-7B-Instruct, эта модель предназначена для общения в режиме помощника. — За пределами области применения: использование любым способом, нарушающим применимые законы и правила (включая законы о торговом регулировании). Используйте на языках, отличных от английского. — Дата выпуска: 18.07.2024 — Версия: 1.0 — Лицензия(и): deepseek-license — Разработчики модели: Neural Magic В тесте HumanEval+ она достигает среднего балла 79,60, тогда как неквантованная модель достигает 79,33. Эта модель была получена путем квантования весов и активаций DeepSeek-Coder-V2-Lite-Instruct к типу данных FP8, готовому к выводу с vLLM >= 0,5.2. Эта оптимизация уменьшает количество бит на параметр с 16 до 8, уменьшая размер диска и требования к памяти графического процессора примерно на 50%. Квантуются только веса и активации линейных операторов внутри блоков преобразователей. Применяется симметричное потензорное квантование, при котором одно линейное масштабирование отображает FP8…

Модальности:
Генерация текста

Области применения:
Диалог / чат Генерация кода Следование инструкциям

Задача: Генерация текста
Автор: RedHatAI
Теги: deepseek_v2, fp8, vllm, conversational, custom_code, text-generation-inference, endpoints_compatible
Лайков: 12 | Загрузок: 133,055

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Vortex5/Dreamstar-12B

TheBloke/CodeLlama-34B-Instruct-fp16

nbeerbower/mistral-nemo-gutenberg-12B

LoneStriker/Nous-Capybara-34B-5.0bpw-h6-exl2