L3-Grand-STORY-16.5B Ultra Quality — тройная модель с тройным ступенчатым слиянием при Full Precision F32. ВНИМАНИЕ: НФВ. Ультра подробный. Графический УЖАС, НАСИЛИЕ. Крайняя ругань. БЕЗ ЦЕНЗУРЫ. УМНЫЙ. Я взял исходную модель в «L3-Stheno-Maid-Blackroot 8B» и полностью перестроил ее с помощью нового сквозного слияния (все сохранилось) и увеличил ее до более чем 16,5 миллиардов параметров — 642 тензора, 71 слоя (оригинал 8B имеет 32 слоя) с точностью Full float 32. Grand Horror 16.5B (здесь) и Grand Story 16.5B Alpha (неизданная) затем объединили их вместе с «шагом сглаживания», зафиксированным с точностью F32. (формула ниже, а также критические замечания и теория по модели слияния). В результате получается модель, которая гораздо более стабильна, гораздо более эффективна, чем любая из трех исходных моделей, и это больше, чем «сумма» двух отмеченных моделей 16.5B. По сравнению с Grand Horror 16.5B он более чем на 25000 пунктов ниже (IQ4XS) по растерянности (чем ниже, тем лучше) или на 2,5 полных уровня ниже по величине. Он жестче, прочнее и может выдерживать гораздо более широкий диапазон рабочих условий — от температуры 0,1 до температуры 5 в течение всего дня. Точность F32 (вместе с полной передачей F32 в ggufs) еще больше повышает производительность. Это добавило…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: DavidAU
Теги: gguf, creative, creative writing, fiction writing, plot generation, sub-plot generation, story generation, scene continue
Лайков: 11 | Загрузок: 271
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.