Метка: post-training - Каталог нейросетей

Метка: post-training

Генерация текста

Jiunsong/SuperGemma-4-12b-abliterated

SuperGemma-4-12b-abliterated — это объединенная контрольная точка 12B, полученная из google/gemma-4-12B-it. 1. Аблитерирующий проход — проход, направленный на отказ...

Генерация текста

chhao/Weak-Driven-Learning

Слабое обучение представляет новую парадигму постобучения, которая бросает вызов традиционному предположению, что обучение с использованием более слабых моделей...

Генерация текста

jpacifico/Chocolatine-2-4B-Instruct-DPO-v2.1

Chocolatine-2-4B-Instruct-DPO-v2.1 — это версия Qwen/Qwen3-4B-Instruct-2507 после обучения, предназначенная для улучшения выполнения инструкций, рассуждения и общей производительности на французском...

Генерация текста

nvidia/NFT-32B

> [!Внимание] > > > 🚨 NFT-32B специально разработан для решения математических задач. Мы не рекомендуем использовать эту...