inferencerlabs/DeepSeek-V4-Flash-MLX-Q2.8-INF

— Вывод текста: ~30 токенов/с @ 2000 токенов ~95,49 ГиБ (отладочная сборка) Q2.8-INF использует независимый от данных метод INF, настроенный для достижения максимальной общей точности в пределах бюджета памяти 128 ГиБ. Эта сборка сжимает модель для работы в пределах ограничений памяти системы ОЗУ объемом 128 ГиБ, сохраняя при этом согласованность ответов. Однако общая точность ухудшается из-за уровня сжатия. Мы не являемся создателем, создателем или владельцем какой-либо из перечисленных моделей. Каждая модель создана и предоставлена третьими лицами. Модели не всегда могут быть точными или контекстуально подходящими. Вы несете ответственность за проверку информации перед принятием важных решений. Мы не несем ответственности за любой ущерб, убытки или проблемы, возникающие в результате его использования, включая потерю данных или неточности в контенте, созданном ИИ.

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: inferencerlabs
Теги: mlx, deepseek_v4, quantized, conversational, en
Лайков: 7 | Загрузок: 2,252

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

yuanzhoulvpi/chinese_bloom_560m

1. ✅ 对bloom-560м, 模型做了sft，在这个数量级和模型规模下,效果非常好！ 2. 🚀训练代码和推理代码全部分享，可以查看链接https://github.com/yuanzhoulvpi2017/zeronlp/tree/main/chinesebloom 1. 🎯 цветение 系列的模型,在中文领域,具有极大的潜力, 在经过有监督微调训练之后, 效果非常惊人！ 2. 🔄 Bloom系列的模型,覆盖中文,英文、代码、法语、西班牙语等。即使拿来做翻译、拿来做代码生成，也都没问题！（后期将会分享相关教程） 3. 😛当前的这个bloom-560m 模型,...

Генерация текста

Похожие модели (Генерация текста)

yuanzhoulvpi/chinese_bloom_560m

unsloth/Llama-3_1-Nemotron-Ultra-253B-v1-GGUF

ISTA-DASLab/Llama-2-70b-AQLM-2Bit-1×16-hf

PatronusAI/Llama-3-Patronus-Lynx-8B-Instruct