RedHatAI/Mistral-7B-Instruct-v0.3-GPTQ-4bit

— Квантование Mistral-7B-Instruct-v0.3 только по весу через GPTQ до 4 бит с group_size=128 — GPTQ оптимизирован для восстановления точности 99,75% относительно неквантованной модели. Эта модель готова для оптимизированного вывода с использованием ядер Marlin смешанной точности в vLLM: https://github.com/vllm-project/vllm

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям

Задача: Генерация текста
Автор: RedHatAI
Теги: mistral, conversational, model-index, text-generation-inference, endpoints_compatible, 4-bit, gptq
Лайков: 23 | Загрузок: 6,724

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

rizerphe/CodeLlama-function-calling-6320-7b-Instruct-hf

YOYO-AI/Qwen3-30B-A3B-Mixture-2507

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

Xenova/Qwen1.5-0.5B-Chat