upstage/Solar-Open-100B - Каталог нейросетей
Генерация текста

upstage/Solar-Open-100B

Добавлено:
upstage/Solar-Open-100B

Solar Open — это флагманская модель большого языка Upstage со 102B параметрами, полностью обученная с нуля и выпущенная по лицензии Upstage Solar (подробности см. в разделе «ЛИЦЕНЗИЯ»). Будучи архитектурой Mixture-of-Experts (MoE), она обеспечивает производительность корпоративного уровня в рассуждениях, следовании инструкциям и агентских возможностях, при этом отдавая приоритет прозрачности и настройке для сообщества открытого исходного кода. Архитектура MoE (102B / 12B): построена на архитектуре смешанного типа с общим количеством 102B / 12B активных параметров. Эта конструкция обеспечивает глубину знаний массивной модели при скорости вывода и экономической эффективности гораздо меньшей модели. Масштабное обучение: предварительное обучение на 19,7 триллионах токенов, обеспечивающее широкий охват знаний и надежные возможности рассуждения в различных областях. Доступна квантовая версия: официальная квантованная модель INT4 предоставлена ​​NotaAI и доступна по адресу nota-ai/Solar-Open-100B-NotaMoEQuant-Int4`. Название модели: Solar Open 100B Hugging Face ID: Upstage/Solar-Open-100B Архитектура: Mixture-of-Experts (MoE) Общие параметры: 102,6B Активные параметры: 12B (на каждый токен) Эксперты: 129 экспертов (8 лучших из 128 направленных + 1 общий) Предварительное обучение…

Модальности:
Генерация текста

Области применения:
Диалог / чат


Задача: Генерация текста
Автор: upstage
Теги: solar_open, upstage, solar, moe, 100b, llm, conversational, en
Лайков: 456  |  Загрузок: 8,163

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.