sparsetral-16x7B-v2-SPIN_iter0
Эта модель sparsetral-16x7B-v2 дополнительно настроена с использованием SPIN на OpenHermes-2.5, смешанного с традиционными образцами DPO. Это итерация_0, планируйте...
Эта модель sparsetral-16x7B-v2 дополнительно настроена с использованием SPIN на OpenHermes-2.5, смешанного с традиционными образцами DPO. Это итерация_0, планируйте...
Эта модель sparsetral-16x7B-v2 дополнительно настроена с использованием SPIN на OpenHermes-2.5, смешанного с традиционными образцами DPO. Это итерация_1, временно...
— 8x A6000 — Раздвоенная версия unsloth для эффективного обучения — Длина последовательности: 4096 — Эффективный размер пакета:...
— 8x A6000 — Раздвоенная версия unsloth для эффективного обучения — Длина последовательности: 4096 — Эффективный размер пакета:...