TheBloke/Speechless-Llama2-Hermes-Orca-Platypus-WizardLM-13B-GPTQ

Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа LLM TheBloke щедро поддерживается грантом от Андреессена Горовица (a16z) — Создатель модели: Цзянвэнь Су — Оригинальная модель: Speechess Lllama2 Hermes Orca-Platypus WizardLM 13B. Этот репозиторий содержит файлы моделей GPTQ для Speechess Lllama2 Цзянвэнь Су Hermes Orca-Platypus WizardLM 13B. Предусмотрено несколько перестановок параметров GPTQ; Подробную информацию о предоставляемых опциях, их параметрах и программном обеспечении, использованном для их создания, см. ниже в разделе «Предоставленные файлы». Модель(и) AWQ для вывода с помощью графического процессора. Модели GPTQ для вывода графического процессора с несколькими вариантами параметров квантования. 2, 3, 4, 5, 6 и 8-битные модели GGUF для вывода CPU+GPU. Оригинальная неквантованная модель fp16 Цзянвэнь Су в формате pytorch, для вывода GPU и дальнейших преобразований. Предоставляется несколько параметров квантования, чтобы вы могли выбрать лучший для вашего оборудования и требований. Каждый отдельный квант находится в отдельной ветви. Ниже приведены инструкции по выборке из разных ветвей. Все последние файлы GPTQ созданы с помощью AutoGPTQ, а все файлы в неосновных ветвях созданы с помощью AutoGPTQ. Файлы в основной ветке, которые…

Модальности:
Генерация текста

Задача: Генерация текста
Автор: TheBloke
Теги: llama, facebook, meta, llama-2, en, text-generation-inference, 4-bit, gptq
Лайков: 22 | Загрузок: 16

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

recursal/QRWKV6-32B-Instruct-Preview-v0.1

sfairXC/FsfairX-Zephyr-Chat-v0.1

ConvexAI/Solutus-3x7B

PartAI/Dorna2-Llama3.1-8B-Instruct