LongCat-Flash-Lite-GGUF
Квантование GGUF meituan-longcat/LongCat-Flash-Lite для использования со специальной вилкой llama.cpp. > Требуется специальная вилка. В этой модели используется новая...
Квантование GGUF meituan-longcat/LongCat-Flash-Lite для использования со специальной вилкой llama.cpp. > Требуется специальная вилка. В этой модели используется новая...
Для этой коллекции квантов ТРЕБУЕТСЯ форк ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не** загружайте эти...
Динамическое квантование DeepSeek-R1-0528 с использованием оптимизированного формата, доступного только на вилке ikllama**, размер которого изменен для работы с...
Кванты в этой коллекции ТРЕБУЮТ вилку ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не загружайте эти...
Этот репозиторий содержит файлы моделей формата GGUF для Youtu-LLM-2B от Tencent. Youtu-LLM-2B — это высокоэффективная модель с параметрами...
Чистый квант Q80 работает как на основной линии, так и на llama.cpp и ikllama.cpp. Другие кванты в этой...
В EraX нами движет любопытство. Мы взяли революционную модель LLaMA 3.1 8B и разработали революционную трансформацию, выборочно интегрируя...
Для этой коллекции квантов ТРЕБУЕТСЯ форк ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не** загружайте эти...
Для этой коллекции квантов ТРЕБУЕТСЯ форк ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не** загружайте эти...
Этот репозиторий предоставляет реализацию PyTorch механизма многоголового скрытого внимания (MLA), представленного в документе DeepSeek-V2. Это не обученная модель,...