bartowski/Pantheon-RP-1.0-8b-Llama-3-GGUF

Исходная модель: https://huggingface.co/Gryphe/Pantheon-RP-1.0-8b-Llama-3. Все кванты выполнены с использованием опции imatrix с набором данных, предоставленным Kalomaze здесь. Если модель больше 50 ГБ, она будет разделена на несколько файлов. Чтобы загрузить их все в локальную папку, запустите: Вы можете либо указать новый локальный каталог (Pantheon-RP-1.0-8b-Llama-3-Q8_0), либо загрузить их все на месте (./). Artefact2 предоставляет отличную статью с диаграммами, показывающими различные характеристики. Первое, что нужно выяснить, это насколько большую модель вы можете запустить. Для этого вам нужно выяснить, сколько у вас оперативной и/или видеопамяти. Если вы хотите, чтобы ваша модель работала как можно БЫСТРО, вам нужно поместить все это в видеопамять вашего графического процессора. Стремитесь к квантованию с размером файла на 1–2 ГБ меньше, чем общий объем видеопамяти вашего графического процессора. Если вам нужно абсолютно максимальное качество, сложите вместе оперативную память вашей системы и видеопамять вашего графического процессора, а затем аналогичным образом возьмите квант с размером файла на 1–2 ГБ меньше, чем эта общая сумма. Далее вам нужно будет решить, хотите ли вы использовать «I-квант» или «К-квант». Если не хотите слишком много думать, возьмите один из К-квантов. Они имеют формат QXKX, например Q5KM. Если вы хотите больше узнать о сорняках, вы можете проверить…

Модальности:
Генерация текста

Области применения:
Следование инструкциям Диалог / чат

Задача: Генерация текста
Автор: bartowski
Теги: gguf, Llama-3, instruct, finetune, chatml, axolotl, roleplay, en
Лайков: 10 | Загрузок: 439

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

mlabonne/Llama-3-SLERP-8B

togethercomputer/evo-1-131k-base

DiscoResearch/mixtral-7b-8expert

webbigdata/ALMA-7B-Ja-GPTQ-Ja-En