GestaltLabs/Ornstein-3.5-9B-V2-GGUF

Квантование GGUF GestaltLabs/Ornstein-3.5-9B-V2 — пост-обучение с подкреплением (V2) Ornstein 3.5 9B. Каждый квант имеет родственную контрольную сумму .sha256, а отдельный видеопроектор (mmproj) поставляет мультимодальную башню для ввода изображения/видео. Шкала качества и скорости с размером кванта; Q4KM — сильное значение по умолчанию для ~8 ГБ видеопамяти/ОЗУ. Каждый квант включает в себя встроенный черновой заголовок модели с мультитокенным прогнозированием (MTP) (GGUF Blockcount` 33), поэтому самоспекулятивное декодирование выполняется из одного файла — отдельная черновая модель не требуется: я аспирант в области визуальной нейробиологии в Университете Торонто, который также тратит слишком много времени на точную настройку, слияние и квантование моделей с открытым весом на арендованных H100 и местном DGX Spark. Все тренировочные вычисления осуществляются за счет собственных средств — затраты на графические процессоры уравновешиваются бюджетом студента. Если мои загрузки были вам полезны, подумайте о том, чтобы купить аспиранту кофе. Это имеет большое значение для продолжения этих экспериментов.

Модальности:
Генерация текста Мультимодальность

Области применения:
Логика и рассуждение Диалог / чат

Задача: Генерация текста
Автор: GestaltLabs
Теги: gguf, llama.cpp, quantized, reasoning, ai-research, qwen3.5, multimodal, mtmd
Лайков: 7 | Загрузок: 832

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

OpenMeditron/Meditron3-8B

lightblue/Karasu-Mixtral-8x22B-v0.1-AWQ

touqir/Cyrax-7B

DavidAU/Qwen3-42B-A3B-2507-Thinking-Abliterated-uncensored-TOTAL-RECALL-v2-Medium-MASTER-CODER