phi-2-GGUF
— Создатель модели: microsoft — Исходная модель: microsoft/phi-2 MaziyarPanahi/phi-2-GGUF содержит файлы моделей формата GGUF для microsoft/phi-2. Спасибо TheBloke...
— Создатель модели: microsoft — Исходная модель: microsoft/phi-2 MaziyarPanahi/phi-2-GGUF содержит файлы моделей формата GGUF для microsoft/phi-2. Спасибо TheBloke...
Тензоры внимания 4-битные, потому что Mixtral повторно использует их для каждого эксперта — поэтому добавляется всего 0,4 ГБ,...
Орнит 1.0 9B, самоквантованный до GGUF с помощью Atomic Chat. Создан прямо на основе исходных весов DeepReinforce с...
Квантование GGUF GestaltLabs/Ornstein-3.5-9B-V2 — пост-обучение с подкреплением (V2) Ornstein 3.5 9B. Каждый квант имеет родственную контрольную сумму .sha256,...
> Создан на основе mlx-optiq, собственного набора инструментов MLX для квантования, точной настройки и обслуживания LLM локально на...
Этот репозиторий содержит квантование GGUF Q6K JetBrains/Mellum2-12B-A2.5B-Instruct, готовое к работе с llama.cpp`, Ollama, LM Studio и другими GGUF-совместимыми...
Квантование Jackrong/Qwopus3.6-27B-v2 в формате AutoAWQ INT4 (W4A16), точная настройка Qwen 3.6 27B, основанная на рассуждениях Клода Опуса. Гибридная...
Плотный магистральный канал Qwen3.6 27B + встроенная головка NextN-MTP, квантованная для вывода с помощью одного графического процессора. —...
> Примечание. ZAYA1-8B использует собственную разреженную архитектуру MoE (ZayaForCausalLM), которая еще не поддерживается llama.cpp. Файлы GGUF будут добавлены...
— Вывод текста: ~30 токенов/с @ 2000 токенов ~95,49 ГиБ (отладочная сборка) Q2.8-INF использует независимый от данных метод...