RedHatAI/DeepSeek-V4-Flash-NVFP4-FP8

Эта модель была получена с использованием следующей ветки с LLM Compressor: https://github.com/vllm-project/llm-compressor/pull/2647 Эта модель была развернута с использованием следующей ветки с vLLM: https://github.com/vllm-project/vllm/pull/41276 Эта модель имеет заметно более низкую точность восстановления, чем базовая модель, из-за того, что базовая модель выпущена в квантованном формате и различия между mxfp4 и nvfp4. Более продвинутые методы, такие как GPTQ, можно использовать для повышения точности восстановления по сравнению с текущим состоянием этой модели. Для получения более подробной информации о том, как эта модель была создана и запущена в LLM Compressor, свяжитесь с Кайлом Сэйерсом на vLLM Slack: https://communityinviter.com/apps/vllm-dev/join-vllm-developers-slack.

Модальности:
Генерация текста

Задача: Генерация текста
Автор: RedHatAI
Теги: deepseek_v4, compressed-tensors, nvfp4, vllm, endpoints_compatible, 8-bit
Лайков: 14 | Загрузок: 5,229

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

bartowski/NousResearch_NousCoder-14B-GGUF

Исходная модель: https://huggingface.co/NousResearch/NousCoder-14B — llama.cpp — LM Studio — koboldcpp — Jan AI — Веб-интерфейс создания текста —...

Генерация текста

jondurbin/airoboros-65b-gpt4-1.2

Это точно настроенная модель LlaMa с параметрами qlora 65b, в которой используются полностью синтетические данные обучения, созданные gpt4...

Генерация текста

jondurbin/airoboros-33b-gpt4-1.2

Это точно настроенная модель LlaMa с 33b параметрами qlora, использующая полностью синтетические данные обучения, созданные gpt4 через https://github.com/jondurbin/airoboros....

Генерация текста

abeja/ABEJA-Qwen2.5-7b-Japanese-v0.1

ABEJA-Qwen2.5-7b-Japanese-v0.1はQwen/Qwen2.5-7B-Instructをベースに日本語の学習をしたモデルです。通常の継続事前学習ではなく、абежа/АБЕДЖА-Квен2.5-3 2b-Japanese-v0.1をベースに蒸留学習を実施したモデルです。 Пост-тренингは実施しておらず、ChatVector(Qwen/Qwen2.5-7B-InstructとQwen/Qwen2.5-7Bの差分ベクトル)により指示追従性能をあげています。 — Хироши Киёта — Кейсуке Фудзимото — Кентаро Наканиси — Кё Хаттори — Шинья Отани...