huawei-csl/Qwen3-1.7B-3bit-SINQ

Этот репозиторий содержит официальную 3-битную квантованную версию модели Qwen3-1.7B с использованием метода SINQ (Sinkhorn-Normalized Quantization). SINQ — это новый, быстрый и высококачественный метод квантования, предназначенный для уменьшения размера любых больших языковых моделей, сохраняя при этом их точность практически неизменной. Чтобы поддержать проект, поставьте звездочку ⭐ в официальном репозитории SINQ на github. — Название модели: Qwen3-1.7B-3bit-SINQ — Базовая модель: Qwen/Qwen3-1.7B — Задача: генерация текста — Платформа: PyTorch/Transformers — Лицензия: Apache-2.0 — Квантизация: Huawei — Лаборатория вычислительных систем — Метод квантования: SINQ (нормализованное квантование по синхорну) — Точность: INT3 — Размер группы: 64 — Платформа: PyTorch — Квантование Библиотека: sinq Если вы найдете SINQ полезным в ваших исследованиях или приложениях, пожалуйста — поставьте звездочку ⭐ в официальном репозитории SINQ на github. — Процитируйте нашу статью:

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: huawei-csl
Теги: qwen3, quantized, sinq, int3, efficient-inference, qwen, llm, compression
Лайков: 7 | Загрузок: 9

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

AXCXEPT/EZO-Qwen2.5-72B-Instruct

bartowski/Qwen2.5-Coder-32B-Instruct-GGUF

TheBloke/Synthia-7B-v1.3-AWQ

LyraNovaHeart/Starfallen-Snow-Fantasy-24B-MS3.2-v0.0