Метка: qwen3_moe - Каталог нейросетей

Метка: qwen3_moe

Генерация текста

third-intelligence/llm-jp-4-kappa-32b-a3b-v0.1

llm-jp-4-kappa-32b-a3b-v0.1 は、Третий интеллект が研究開発の一環で試作した日本語・英語対応の Thinking型大規模言語モデルです。llm-jp/llm-jp-4-32b-a3b-думаю をベースに、 — Рассуждение(思考プロセスの生成)能力を強化するための SFT (контролируемая точная настройка) — 数学・コード領域における強化学習 (Обучение с подкреплением) の...

Генерация текста

ATH-MaaS/Marco-Mini-Global-Base

Marco-Mini-Global-Base — это расширенный вариант Marco-Mini-Base, который масштабирует лингвистический охват с 29 до 64 языков. Это очень редкая...

Генерация текста

apple/SimpleSD-30B-instruct

Эта модель является примером метода простой самодистилляции (SimpleSD), который улучшает генерацию кода за счет точной настройки языковой модели...

Генерация текста

huihui-ai/Huihui-MiroThinker-v1.5-30B-abliterated

Это версия miromind-ai/MiroThinker-v1.5-30B без цензуры, созданная с помощью аблитерации (более подробную информацию об этом см. в разделе «Удалить-отказы-с-трансформерами»)....

Генерация текста

YOYO-AI/Qwen3-30B-A3B-YOYO-V6

> В этом обновлении представлен алгоритм слияния второго поколения и продемонстрирован еще один режим YOYO-Fusion — режим фиксированной...

Генерация текста

YOYO-AI/Qwen3-30B-A3B-YOYO-AutoThink

> Это модель автоматического мышления и переключения, созданная с использованием методов слияния моделей и замены экспертов: она напрямую...

Генерация текста

YOYO-AI/Qwen3-30B-A3B-YOYO-V3

> Эта модель заполняет пробел, из-за которого в серии Qwen 2507 отсутствуют гибридные модели, и полностью сочетает в...