Метка: moe - Страница 2 - Каталог нейросетей

Генерация текста

Kquant03/CognitiveFusion-4x7B-bf16-MoE

!image/png (Изображение предоставлено NeuralNovel) ФАЙЛЫ GGUF ЗДЕСЬ!!!! Ко мне обратилась с идеей сделать слияние на основе рассказывания историй,...

Генерация текста

autotrust/DeepSeek-V4-Flash-DSpark-4E

Это контрольная точка DeepSeek-V4-Flash-DSpark — модель MoE 284B с модулем спекулятивного декодирования (DSpark), настроенная и оцененная с помощью...

Генерация текста

SixVolts/GLM-5.2-ewaste-edition-GGUF

Квантование Imatrix GGUF GLM-5.2 (всего 745B / ~40B активно, glm-dsa Arch, MoE в стиле DeepSeek с 256 маршрутизируемыми...

Генерация текста

JetBrains/Mellum2-12B-A2.5B-Instruct-GGUF-Q6_K

Этот репозиторий содержит квантование GGUF Q6K JetBrains/Mellum2-12B-A2.5B-Instruct, готовое к работе с llama.cpp`, Ollama, LM Studio и другими GGUF-совместимыми...

Генерация текста

cyberneurova/CyberNeurova-Qwen3.6-35B-A3B-abliterated

> Исследование CyberNeurova — cyberneurova.ai. > Многоосная аблитерация на модели чата МО с гибридным вниманием и режимом мышления....

Генерация текста

DavidAU/LFM2-8B-A1B-GLM-4.7-Flash-Thinking-Quantum-IQ1C-P

Точная настройка «LFM2-8B-A1B» с помощью Unsloth с использованием пользовательских наборов данных, контекст 128 КБ с точностью до 16...

Генерация текста

DavidAU/NVIDIA-Nemotron-Labs-3-Elastic-12B-A2B

Это версия 12B-A2B NVIDIA-Nemotron-Labs-3-Elastic-30B-A3B-BF16 с использованием сценария извлечения Nvidia. Это модель мышления/рассуждения; его мыслительный блок/следы очень короткие. Почти...

Генерация текста

lordx64/Qwen3.6-35B-A3B-Kimi-K2.6-Reasoning-Distilled-GGUF

Квантование GGUF lordx64/Qwen3.6-35B-A3B-Kimi-K2.6-Reasoning-Distilled для использования с llama.cpp и LM Studio. Базовая модель представляет собой усовершенствованный вариант Qwen3.6-35B-A3B, доработанный...

Генерация текста

Brooooooklyn/Qwen3.6-35B-A3B-UD-Q8_K_XL-mlx

8-битное базовое квантование смешанной точности Qwen/Qwen3.6-35B-A3B для Apple Silicon с использованием стратегии квантования Unsloth Dynamic через mlx-node. Проведено...

Генерация текста

Brooooooklyn/Qwen3.6-35B-A3B-UD-Q2_K_XL-mlx

2-битное базовое квантование смешанной точности Qwen/Qwen3.6-35B-A3B для Apple Silicon с использованием стратегии квантования Unsloth Dynamic через mlx-node. Проведено...