Метка: reinforcement - Каталог нейросетей

Метка: reinforcement

Генерация текста

SakanaAI/RLT-32B

Этот репозиторий содержит модель ученика с 32B параметрами, обученную с использованием конвейера учителей с подкреплением (RLT), представленного в...

Генерация текста

SakanaAI/RLT-7B

Этот репозиторий содержит модель ученика с параметрами 7B, обученную с использованием конвейера учителей с подкреплением (RLT), представленного в...