Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области LLM щедро поддерживается грантом от Андреессена Горовица (a16z). Предоставляется несколько перестановок параметров GPTQ; Подробную информацию о предоставляемых опциях, их параметрах и программном обеспечении, использованном для их создания, см. ниже в разделе «Предоставленные файлы». Эти файлы были квантованы с использованием оборудования, любезно предоставленного Massed Compute. Модели GPTQ для вывода графического процессора с несколькими вариантами параметров квантования. 2, 3, 4, 5, 6 и 8-битные модели GGUF для вывода CPU+GPU * Исходная неквантованная модель fp16 01-ai в формате pytorch, для вывода GPU и для дальнейших преобразований. Известно, что эти модели GPTQ работают на следующих серверах вывода/веб-интерфейсах. — text-generation-webui — KoboldAI United — Веб-интерфейс LoLLMS — Вывод генерации текста обнимающего лица (TGI) Возможно, это не полный список; если вы знаете других, пожалуйста, дайте мне знать! Предусмотрено несколько параметров квантования, чтобы вы могли выбрать лучший для вашего оборудования и требований. Каждый отдельный квант находится в отдельной ветви. Ниже приведены инструкции по выборке из разных ветвей. Большинство файлов GPTQ создаются с помощью AutoGPTQ.…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: TheBloke
Теги: Yi, custom_code, 4-bit, gptq
Лайков: 32 | Загрузок: 9
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.