Метка: mla

Генерация текста

InquiringMinds-AI/LongCat-Flash-Lite-GGUF

Квантование GGUF meituan-longcat/LongCat-Flash-Lite для использования со специальной вилкой llama.cpp. > Требуется специальная вилка. В этой модели используется новая...

Генерация текста

ubergarm/DeepSeek-V3.1-Terminus-GGUF

Для этой коллекции квантов ТРЕБУЕТСЯ форк ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не** загружайте эти...

Генерация текста

anikifoss/DeepSeek-R1-0528-DQ4_K_R4

Динамическое квантование DeepSeek-R1-0528 с использованием оптимизированного формата, доступного только на вилке ikllama**, размер которого изменен для работы с...

Генерация текста

ubergarm/Kimi-K2.5-GGUF

Кванты в этой коллекции ТРЕБУЮТ вилку ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не загружайте эти...

Генерация текста

AaryanK/Youtu-LLM-2B-GGUF

Этот репозиторий содержит файлы моделей формата GGUF для Youtu-LLM-2B от Tencent. Youtu-LLM-2B — это высокоэффективная модель с параметрами...

Генерация текста

ubergarm/GigaChat3-10B-A1.8B-GGUF

Чистый квант Q80 работает как на основной линии, так и на llama.cpp и ikllama.cpp. Другие кванты в этой...

Генерация текста

erax-ai/EraX-LLaMA3.1-8B-DeepSeekR1-MLA-MoE-Raw

В EraX нами движет любопытство. Мы взяли революционную модель LLaMA 3.1 8B и разработали революционную трансформацию, выборочно интегрируя...

Генерация текста

ubergarm/DeepSeek-V3.1-GGUF

Для этой коллекции квантов ТРЕБУЕТСЯ форк ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не** загружайте эти...

Генерация текста

ubergarm/Kimi-K2-Instruct-0905-GGUF

Для этой коллекции квантов ТРЕБУЕТСЯ форк ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не** загружайте эти...

Генерация текста

bird-of-paradise/deepseek-mla

Этот репозиторий предоставляет реализацию PyTorch механизма многоголового скрытого внимания (MLA), представленного в документе DeepSeek-V2. Это не обученная модель,...