Для этой коллекции квантов ТРЕБУЕТСЯ форк ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не** загружайте эти большие файлы и рассчитывайте, что они будут работать на основных версиях vanilla llama.cpp, ollama, LM Studio, KoboldCpp и т. д.! ПРИМЕЧАНИЕ. ikllama.cpp` также может запускать существующие GGUF от bartowski, unsloth, mradermacher и т. д., если вы хотите опробовать его перед загрузкой моих квантов. Некоторые из новых квантов ik поддерживаются форком Nexesenex/croco.cpp KoboldCPP. Эти кванты обеспечивают лучшую в своем классе степень недоумения при заданном объеме памяти. Привет Венделлу и команде Level1Techs, форумам сообщества и каналу YouTube! ОГРОМНОЕ спасибо за предоставленную БОЛЬШУЮ экспертизу в области аппаратного обеспечения и доступ для проведения этих экспериментов и за то, что сделали эти замечательные квантовые данные доступными для сообщества!!! Также спасибо всем участникам сообщества по количественному анализу и выводам на BeaverAI Club Discord и на r/LocalLLaMA за советы и подсказки, помогающие друг другу запускать, тестировать и тестировать все интересные новые модели! Обновлены новые лучшие рецепты с меньшим недоумением и самый маленький в мире Kimi-K2-Instruct-smol-IQ1_KT с 219,375 GIB (1,835) BPW. Пожалуйста, задавайте любые вопросы в этом обсуждении здесь, спасибо! Старые версии все еще доступны, как описано в…
Модальности:
Генерация текста
Области применения:
Диалог / чат Следование инструкциям
Задача: Генерация текста
Автор: ubergarm
Теги: gguf, mla, imatrix, conversational, ik_llama.cpp, endpoints_compatible
Лайков: 22 | Загрузок: 390
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.