CognitiveFusion-4x7B-bf16-MoE
!image/png (Изображение предоставлено NeuralNovel) ФАЙЛЫ GGUF ЗДЕСЬ!!!! Ко мне обратилась с идеей сделать слияние на основе рассказывания историй,...
!image/png (Изображение предоставлено NeuralNovel) ФАЙЛЫ GGUF ЗДЕСЬ!!!! Ко мне обратилась с идеей сделать слияние на основе рассказывания историй,...
Это контрольная точка DeepSeek-V4-Flash-DSpark — модель MoE 284B с модулем спекулятивного декодирования (DSpark), настроенная и оцененная с помощью...
Квантование Imatrix GGUF GLM-5.2 (всего 745B / ~40B активно, glm-dsa Arch, MoE в стиле DeepSeek с 256 маршрутизируемыми...
Этот репозиторий содержит квантование GGUF Q6K JetBrains/Mellum2-12B-A2.5B-Instruct, готовое к работе с llama.cpp`, Ollama, LM Studio и другими GGUF-совместимыми...
> Исследование CyberNeurova — cyberneurova.ai. > Многоосная аблитерация на модели чата МО с гибридным вниманием и режимом мышления....
Точная настройка «LFM2-8B-A1B» с помощью Unsloth с использованием пользовательских наборов данных, контекст 128 КБ с точностью до 16...
Это версия 12B-A2B NVIDIA-Nemotron-Labs-3-Elastic-30B-A3B-BF16 с использованием сценария извлечения Nvidia. Это модель мышления/рассуждения; его мыслительный блок/следы очень короткие. Почти...
Квантование GGUF lordx64/Qwen3.6-35B-A3B-Kimi-K2.6-Reasoning-Distilled для использования с llama.cpp и LM Studio. Базовая модель представляет собой усовершенствованный вариант Qwen3.6-35B-A3B, доработанный...
8-битное базовое квантование смешанной точности Qwen/Qwen3.6-35B-A3B для Apple Silicon с использованием стратегии квантования Unsloth Dynamic через mlx-node. Проведено...
2-битное базовое квантование смешанной точности Qwen/Qwen3.6-35B-A3B для Apple Silicon с использованием стратегии квантования Unsloth Dynamic через mlx-node. Проведено...