Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области LLM щедро поддерживается грантом от Андреессена Горовица (a16z) — Создатель модели: Saofiq — Исходная модель: Euryale 1.3 L2 70B. Этот репозиторий содержит файлы моделей GPTQ для Euryale 1.3 L2 70B от Saofiq. Предусмотрено несколько перестановок параметров GPTQ; Подробную информацию о предоставляемых опциях, их параметрах и программном обеспечении, использованном для их создания, см. ниже в разделе «Предоставленные файлы». Модель(и) AWQ для вывода с помощью графического процессора. Модели GPTQ для вывода графического процессора с несколькими вариантами параметров квантования. 2, 3, 4, 5, 6 и 8-битные модели GGUF для вывода CPU+GPU. Оригинальная неквантованная модель fp16 Saofiq в формате pytorch для вывода GPU и дальнейших преобразований. Предоставляется несколько параметров квантования, чтобы вы могли выбрать лучший для вашего оборудования и требований. Каждый отдельный квант находится в отдельной ветви. Ниже приведены инструкции по выборке из разных ветвей. Большинство файлов GPTQ создаются с помощью AutoGPTQ. Модели Mistral в настоящее время производятся с использованием трансформеров. — Биты: размер бит квантованной модели. — GS: размер группы GPTQ. Более высокие значения используют меньше видеопамяти, но имеют меньшие значения…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: TheBloke
Теги: llama, en, text-generation-inference, 4-bit, gptq
Лайков: 6 | Загрузок: 4
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.