Чтобы узнать больше о выводе, а также о том, как самостоятельно квантовать модели, обратитесь к официальному репозиторию GitHub.
Модальности:
Генерация текста
Задача: Генерация текста
Автор: ISTA-DASLab
Теги: gemma, text-generation-inference, endpoints_compatible, aqlm
Лайков: 6 | Загрузок: 340
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.