Метка: mla - Каталог нейросетей

Метка: mla

Генерация текста

InquiringMinds-AI/LongCat-Flash-Lite-GGUF

Квантование GGUF meituan-longcat/LongCat-Flash-Lite для использования со специальной вилкой llama.cpp. > Требуется специальная вилка. В этой модели используется новая...

Генерация текста

ubergarm/DeepSeek-V3.1-Terminus-GGUF

Для этой коллекции квантов ТРЕБУЕТСЯ форк ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не** загружайте эти...

Генерация текста

anikifoss/DeepSeek-R1-0528-DQ4_K_R4

Динамическое квантование DeepSeek-R1-0528 с использованием оптимизированного формата, доступного только на вилке ikllama**, размер которого изменен для работы с...

Генерация текста

ubergarm/Kimi-K2.5-GGUF

Кванты в этой коллекции ТРЕБУЮТ вилку ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не загружайте эти...

Генерация текста

AaryanK/Youtu-LLM-2B-GGUF

Этот репозиторий содержит файлы моделей формата GGUF для Youtu-LLM-2B от Tencent. Youtu-LLM-2B — это высокоэффективная модель с параметрами...

Генерация текста

ubergarm/DeepSeek-V3.1-GGUF

Для этой коллекции квантов ТРЕБУЕТСЯ форк ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не** загружайте эти...

Генерация текста

ubergarm/Kimi-K2-Instruct-0905-GGUF

Для этой коллекции квантов ТРЕБУЕТСЯ форк ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не** загружайте эти...

Генерация текста

bird-of-paradise/deepseek-mla

Этот репозиторий предоставляет реализацию PyTorch механизма многоголового скрытого внимания (MLA), представленного в документе DeepSeek-V2. Это не обученная модель,...