ubergarm/Kimi-K2-Instruct-GGUF

Для этой коллекции квантов ТРЕБУЕТСЯ форк ikllama.cpp для поддержки последних квантов и оптимизаций SOTA ik! Не** загружайте эти большие файлы и рассчитывайте, что они будут работать на основных версиях vanilla llama.cpp, ollama, LM Studio, KoboldCpp и т. д.! ПРИМЕЧАНИЕ. ikllama.cpp` также может запускать существующие GGUF от bartowski, unsloth, mradermacher и т. д., если вы хотите опробовать его перед загрузкой моих квантов. Некоторые из новых квантов ik поддерживаются форком Nexesenex/croco.cpp KoboldCPP. Эти кванты обеспечивают лучшую в своем классе степень недоумения при заданном объеме памяти. Привет Венделлу и команде Level1Techs, форумам сообщества и каналу YouTube! ОГРОМНОЕ спасибо за предоставленную БОЛЬШУЮ экспертизу в области аппаратного обеспечения и доступ для проведения этих экспериментов и за то, что сделали эти замечательные квантовые данные доступными для сообщества!!! Также спасибо всем участникам сообщества по количественному анализу и выводам на BeaverAI Club Discord и на r/LocalLLaMA за советы и подсказки, помогающие друг другу запускать, тестировать и тестировать все интересные новые модели! Обновлены новые лучшие рецепты с меньшим недоумением и самый маленький в мире Kimi-K2-Instruct-smol-IQ1_KT с 219,375 GIB (1,835) BPW. Пожалуйста, задавайте любые вопросы в этом обсуждении здесь, спасибо! Старые версии все еще доступны, как описано в…

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям

Задача: Генерация текста
Автор: ubergarm
Теги: gguf, mla, imatrix, conversational, ik_llama.cpp, endpoints_compatible
Лайков: 22 | Загрузок: 390

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Undi95/MXLewd-L2-20B

nvidia/Qwen3-Nemotron-32B-RLBFF

bartowski/Negative_LLAMA_70B-GGUF

TheBloke/minotaur-15B-GGML