huawei-csl/Qwen3-1.7B-3bit-SINQ - Каталог нейросетей
Генерация текста

huawei-csl/Qwen3-1.7B-3bit-SINQ

Добавлено:
huawei-csl/Qwen3-1.7B-3bit-SINQ

Этот репозиторий содержит официальную 3-битную квантованную версию модели Qwen3-1.7B с использованием метода SINQ (Sinkhorn-Normalized Quantization). SINQ — это новый, быстрый и высококачественный метод квантования, предназначенный для уменьшения размера любых больших языковых моделей, сохраняя при этом их точность практически неизменной. Чтобы поддержать проект, поставьте звездочку ⭐ в официальном репозитории SINQ на github. — Название модели: Qwen3-1.7B-3bit-SINQ — Базовая модель: Qwen/Qwen3-1.7B — Задача: генерация текста — Платформа: PyTorch/Transformers — Лицензия: Apache-2.0 — Квантизация: Huawei — Лаборатория вычислительных систем — Метод квантования: SINQ (нормализованное квантование по синхорну) — Точность: INT3 — Размер группы: 64 — Платформа: PyTorch — Квантование Библиотека: sinq Если вы найдете SINQ полезным в ваших исследованиях или приложениях, пожалуйста — поставьте звездочку ⭐ в официальном репозитории SINQ на github. — Процитируйте нашу статью:

Модальности:
Генерация текста

Области применения:
Диалог / чат


Задача: Генерация текста
Автор: huawei-csl
Теги: qwen3, quantized, sinq, int3, efficient-inference, qwen, llm, compression
Лайков: 7  |  Загрузок: 9

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.