Метка: deepseek_v4

Генерация текста

autotrust/DeepSeek-V4-Flash-DSpark-4E

Это контрольная точка DeepSeek-V4-Flash-DSpark — модель MoE 284B с модулем спекулятивного декодирования (DSpark), настроенная и оцененная с помощью...

Генерация текста

inferencerlabs/DeepSeek-V4-Flash-MLX-Q2.8-INF

— Вывод текста: ~30 токенов/с @ 2000 токенов ~95,49 ГиБ (отладочная сборка) Q2.8-INF использует независимый от данных метод...

Генерация текста

Thump604/DeepSeek-V4-Flash-MLX-Q2-mixed-gs128-affine

— Базовая модель: deepseek-ai/DeepSeek-V4-Flash — Исходная версия: 6e763230a9d263eca2023f1d4a5ce1bfe126cf48 — Архитектура: DeepseekV4ForCausalLM — Тип модели: deepseekv4` — Ветка инструментов:...

Генерация текста

canada-quant/DeepSeek-V4-Flash-W4A16-FP8-MTP

W4A16 INT4 маршрутизирует экспертов + блок FP8 128×128 внимания + черновой заголовок BF16 Multi-Token Prediction (MTP) сохранен —...

Генерация текста

huihui-ai/DeepSeek-V4-Flash-BF16

Если вам недостаточно памяти графического процессора, мы рекомендуем протестировать ее с использованием памяти процессора. Вы можете подписаться на...

Генерация текста

OsaurusAI/DeepSeek-V4-Flash-JANGTQ2

DeepSeek-V4-Flash — 79,6 ГБ на диске (по сравнению с 149 ГБ источника FP4+FP8) — единообразное 2-битное квантование JANGTQ...

Генерация текста

mlx-community/deepseek-ai-DeepSeek-V4-Flash-8bit

Эта модель mlx-community/deepseek-ai-DeepSeek-V4-Flash-8bit была преобразована в формат MLX из deepseek-ai/DeepSeek-V4-Flash с использованием mlx-lm версии 0.31.3. Модальности:Генерация текста Задача:...

Генерация текста

mlx-community/DeepSeek-V4-Flash-4bit

Модель генерации текста Модальности:Генерация текста Области применения:Диалог / чат Задача: Генерация текста Автор: mlx-community Теги: mlx, deepseek_v4, conversational,...

Генерация текста

RedHatAI/DeepSeek-V4-Flash-NVFP4-FP8

Эта модель была получена с использованием следующей ветки с LLM Compressor: https://github.com/vllm-project/llm-compressor/pull/2647 Эта модель была развернута с использованием...

Генерация текста

Intel/DeepSeek-V4-Flash-W4A16-AutoRound

Эта модель представляет собой модель int4 с group_size 128 для deepseek-ai/DeepSeek-V4-Flash, созданную с помощью Intel/автоматического округления в режиме...