Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области LLM щедро поддерживается грантом от andreessen horowitz (a16z). Этот репозиторий содержит файлы моделей GPTQ для Llamix2 MLewd 4X13B от Undi. Для Mixtral GPTQ в настоящее время требуются: Transformers 4.36.0 или новее, AutoGPTQ 0.6, скомпилированный из исходного кода, или Transformers 4.37.0.dev0, скомпилированный из Github с помощью: pip3 install git+https://github.com/huggingface/transformers` Предоставляется несколько перестановок параметров GPTQ; Подробную информацию о предоставляемых опциях, их параметрах и программном обеспечении, использованном для их создания, см. ниже в разделе «Предоставленные файлы». Модели GPTQ для вывода графического процессора с несколькими вариантами параметров квантования. 2, 3, 4, 5, 6 и 8-битные модели GGUF для вывода CPU+GPU * Исходная неквантованная модель fp16 Undi в формате pytorch для вывода GPU и дальнейших преобразований модели GPTQ в настоящее время поддерживаются в Linux (NVidia/AMD) и Windows (только NVidia). Пользователи macOS: используйте модели GGUF. В настоящее время к Mixtral GPTQ предъявляются особые требования — см. описание выше. Предусмотрено несколько параметров квантования, чтобы вы могли выбрать лучший для вашего оборудования и требований.…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: TheBloke
Теги: mixtral, not-for-all-audiences, nsfw, text-generation-inference, 4-bit, gptq
Лайков: 8 | Загрузок: 15
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.