Lewdiculous/Kunoichi-DPO-v2-7B-GGUF-Imatrix

> [!TIP] > Поддержка: > В последнее время моя скорость загрузки была нестабильной и нестабильной. > На самом деле мне придется переехать, чтобы найти лучшего поставщика. > Если хочешь и можешь… > Поддержать различные мои начинания можно здесь (Ко-фи). > Я прошу прощения за то, что нарушил ваш опыт. Это расшифровывается как «Матрица важности» — метод, используемый для улучшения качества квантованных моделей. Imatrix рассчитывается на основе данных калибровки и помогает определить важность различных активаций модели в процессе квантования. Идея состоит в том, чтобы сохранить наиболее важную информацию во время квантования, что может помочь уменьшить потерю производительности модели. Одним из преимуществ использования Imatrix является то, что это может привести к повышению производительности модели, особенно когда данные калибровки разнообразны. Дополнительная информация: [[1]](https://github.com/ggerganov/llama.cpp/discussions/5006) [[2]](https://github.com/ggerganov/llama.cpp/discussions/5263#discussioncomment-8395384) Если вы хотите добавить какое-либо конкретное квантование, не стесняйтесь спрашивать. Для данных —imatrix использовался imatrix-Kunoichi-DPO-v2-7B-F16.dat.

Модальности:
Генерация текста

Задача: Генерация текста
Автор: Lewdiculous
Теги: gguf, mistral, quantized, text-generation-inference
Лайков: 50 | Загрузок: 1,977

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

mlx-community/Phi-3-vision-128k-instruct-4bit

Dogge/llama-3-70B-instruct-uncensored

nvidia/gpt-oss-120b-Eagle3-v3

TheBloke/airoboros-l2-13b-gpt4-m2.0-GPTQ