ПРИМЕЧАНИЕ. ikllama.cpp` также может запускать существующие GGUF от bartowski, unsloth, mradermacher и т. д., если вы хотите опробовать его перед загрузкой моих квантов. Некоторые из новых квантов ik поддерживаются форком Nexesenex/croco.cpp KoboldCPP со сборками Windows для CUDA 12.9. Также проверьте наличие сборок Windows от Thireus здесь. которые были CUDA 12.8. Эти кванты обеспечивают лучшую в своем классе степень недоумения при заданном объеме памяти. Привет Венделлу и команде Level1Techs, форумам сообщества и каналу YouTube! ОГРОМНОЕ спасибо за предоставленную БОЛЬШУЮ экспертизу в области аппаратного обеспечения и доступ для проведения этих экспериментов и за то, что сделали эти замечательные квантовые данные доступными для сообщества!!! Также спасибо всем участникам сообщества по количественному анализу и выводам на BeaverAI Club Discord и на r/LocalLLaMA за советы и подсказки, помогающие друг другу запускать, тестировать и тестировать все интересные новые модели! Спасибо HuggingFace за организацию всех этих больших квантов! Наконец, я очень ценю поддержку со стороны aifoundry.org, поэтому ознакомьтесь с их решениями на базе RISC-V с открытым исходным кодом! Это всего лишь тестовые кванты для сравнения базовой сложности: Q80 664,295 ГиБ (8,504 BPW) — Окончательная оценка: PPL более 561 фрагмента для n_ctx=512 = 3,2082 +/- 0,01742 Итоговая…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: ubergarm
Теги: gguf, imatrix, conversational, ik_llama.cpp, deepseek_v32, endpoints_compatible
Лайков: 18 | Загрузок: 259
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.