Этот репозиторий предоставляет квантованную FP8 версию флагманской модели Upstage — Solar-Open-100B. — Базовая модель: Solar-Open-100B — Квантование: FP8 (вес: поканальный/статический, активация: по токену/динамический) — Требования к оборудованию: Минимум:** 2 x NVIDIA A100 (80 ГБ) Этот репозиторий содержит как веса моделей, так и код, которые лицензируются на различных условиях: 1. ВЕС МОДЕЛИ (.safetensors) Лицензия Upstage Solar License** См.: https://huggingface.co/upstage/Solar-Open-100B/blob/main/LICENSE 2. КОД (файлы .py, .json, .jinja) Лицензия Apache License 2.0** См.: https://www.apache.org/licenses/LICENSE-2.0 * Примечание. ↑ / ↓ обозначают направление улучшения: чем выше, тем лучше (↑), чем ниже, тем лучше. (↓). — Поскольку мы использовали меньший бюджет на мышление, результаты для HRM8K и CLiCK немного ниже, чем цифры, указанные в исходном репозитории Solar-Open-100B. — Память относится к чистому объему видеопамяти, занимаемому только весами модели.
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: nota-ai
Теги: solar_open, upstage, solar, moe, 100b, llm, nota, quantization
Лайков: 31 | Загрузок: 184
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.