TheBloke/dolphin-2.7-mixtral-8x7b-GPTQ

Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области LLM щедро поддерживается грантом от Андреессена Горовица (a16z) — Создатель модели: Cognitive Computations — Исходная модель: Dolphin 2.7 Mixtral 8X7B. Этот репозиторий содержит файлы моделей GPTQ для Dolphin 2.7 Mixtral 8X7B от Cognitive Computations. Предусмотрено несколько перестановок параметров GPTQ; Подробную информацию о предоставляемых опциях, их параметрах и программном обеспечении, использованном для их создания, см. ниже в разделе «Предоставленные файлы». Эти файлы были квантованы с использованием оборудования, любезно предоставленного Massed Compute. Модель(и) AWQ для вывода графического процессора. Модели GPTQ для вывода графического процессора с несколькими вариантами параметров квантования. 2, 3, 4, 5, 6 и 8-битные модели GGUF для вывода CPU+GPU. Исходная неквантованная модель fp16 компании Cognitive Computations в формате pytorch для вывода GPU и дальнейших преобразований. Модели GPTQ в настоящее время поддерживаются в Linux (NVidia/AMD) и Windows (только NVidia). Пользователи macOS: используйте модели GGUF. Известно, что эти модели GPTQ работают на следующих серверах вывода/веб-интерфейсах. — text-generation-webui — KoboldAI United — Веб-интерфейс LoLLMS — Вывод генерации текста обнимающего лица (TGI) Это…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: TheBloke
Теги: mixtral, conversational, en, text-generation-inference, 4-bit, gptq
Лайков: 19 | Загрузок: 33

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

mlx-community/DeepSeek-R1-Distill-Llama-70B-4bit

google/shieldgemma-2b

LiquidAI/LFM2-2.6B-GGUF

RedHatAI/Meta-Llama-3.1-8B-Instruct-quantized.w8a8