PrimaMonarch-EroSumika-2×10.7B-128k
Экспериментальное MoE, идея состоит в том, чтобы иметь больше активных параметров, чем у модели 7xX, и сохранять ее...
Экспериментальное MoE, идея состоит в том, чтобы иметь больше активных параметров, чем у модели 7xX, и сохранять ее...
Обработал все модели лазером, затем снова объединил. Надеюсь, это улучшение моей исходной модели. Конфиг выглядит так… (подробная версия...
Модель для проверки того, как МО будет прокладывать трассу без расширения площади. Масштаб модели является одним из наиболее...
Доработанная модель на английском языке с использованием метода MoE. Улучшенная версия от FusionNet7Bx2MoE_14B. FusionNet7Bx2MoE_v0.1 — это модель для...
Тренажер DPO с набором данных Intel/orcadpopairs для улучшения [yunconglong/TruthfulDPOtomGrcFusionNet7Bx2MoE_13B] Модальности:Генерация текста Задача: Генерация текста Автор: yunconglong Теги: mixtral,...
[Серия Umbra] является ответвлением [Серии Lumosia]. Ее цель — стать главным помощником, умеющим рассказывать истории, и RP/ERP Umbra...
ФранкенМО не только использует гораздо лучшую методологию и фундаментальное понимание SMoE, но и полностью сосредоточено на интеллектуальной ролевой...
Тензоры внимания 4-битные, потому что Mixtral повторно использует их для каждого эксперта — поэтому добавляется всего 0,4 ГБ,...
Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области...
Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области...