TheBloke/CodeLlama-34B-Python-GPTQ

Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области LLM щедро поддерживается грантом от Андреессена Горовица (a16z) — Создатель модели: Meta — Исходная модель: CodeLlama 34B Python. Этот репозиторий содержит файлы моделей GPTQ для Meta’s CodeLlama 34B Python. Предусмотрено несколько перестановок параметров GPTQ; Подробную информацию о предоставляемых опциях, их параметрах и программном обеспечении, использованном для их создания, см. ниже в разделе «Предоставленные файлы». Модель(и) AWQ для вывода с помощью графического процессора. Модели GPTQ для вывода графического процессора с несколькими вариантами параметров квантования. 2, 3, 4, 5, 6 и 8-битные модели GGUF для вывода CPU+GPU. Оригинальная неквантованная модель fp16 Meta в формате pytorch, для вывода GPU и дальнейших преобразований. Transformers>=4.32.0 оптимум>=1.12.0 pip3 install auto-gptq —extra-index-url https://huggingface.github.io/autogptq-index/whl/cu118/ # Используйте cu117, если в оболочке CUDA 11.7 pip3 uninstall -y auto-gptq git clone https://github.com/PanQiWei/AutoGPTQ cd Установка AutoGPTQ pip3. оболочка pip3 удалить -y преобразователи pip3 установить…

Модальности:
Генерация текста

Области применения:
Генерация кода

Языки программирования:
Python

Задача: Генерация текста
Автор: TheBloke
Теги: llama, llama-2, custom_code, code, text-generation-inference, 4-bit, gptq
Лайков: 14 | Загрузок: 25

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

ValiantLabs/Llama2-70B-ShiningValiant

inclusionAI/Ling-Coder-lite

Yukang/Llama-2-13b-longlora-64k

BelleGroup/BELLE-7B-1M