Этот репозиторий содержит официальную 3-битную квантованную версию модели Qwen3-1.7B с использованием метода SINQ (Sinkhorn-Normalized Quantization). SINQ — это новый, быстрый и высококачественный метод квантования, предназначенный для уменьшения размера любых больших языковых моделей, сохраняя при этом их точность практически неизменной. Чтобы поддержать проект, поставьте звездочку ⭐ в официальном репозитории SINQ на github. — Название модели: Qwen3-1.7B-3bit-SINQ — Базовая модель: Qwen/Qwen3-1.7B — Задача: генерация текста — Платформа: PyTorch/Transformers — Лицензия: Apache-2.0 — Квантизация: Huawei — Лаборатория вычислительных систем — Метод квантования: SINQ (нормализованное квантование по синхорну) — Точность: INT3 — Размер группы: 64 — Платформа: PyTorch — Квантование Библиотека: sinq Если вы найдете SINQ полезным в ваших исследованиях или приложениях, пожалуйста — поставьте звездочку ⭐ в официальном репозитории SINQ на github. — Процитируйте нашу статью:
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: huawei-csl
Теги: qwen3, quantized, sinq, int3, efficient-inference, qwen, llm, compression
Лайков: 7 | Загрузок: 9
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.