MicroThinker-1B-Preview, новая модель, доработанная на основе удаленной модели huihui-ai/Llama-3.2-1B-Instruct, ориентированная на расширение возможностей рассуждения ИИ. В процессе тонкой настройки использовалось только 20 000 записей из каждого набора данных. Процесс SFT (контролируемая точная настройка) разделен на несколько этапов, и писать код не требуется. 1. Создайте среду. 3. Использовался только набор данных huihui-ai/QWQ-LONGCOT-500K (#20000), обучение проводилось в течение 1 эпохи: 4. Сохраните точно настроенную модель. После того, как вы закончите, введите выход, чтобы выйти. Замените указанные ниже каталоги конкретными. Это должно создать новый каталог модели: checkpoint-1237-merged. Скопируйте или переместите этот каталог в каталог huihui. 6. Комбинированное обучение с наборами данных huihui-ai/QWQ-LONGCOT-500K (#20000) и huihui-ai/LONGCOT-Refine (#20000), обучение для 1 эпохи: 7. Сохраните окончательную точно настроенную модель. После того, как вы закончите, введите выход, чтобы выйти. Замените указанные ниже каталоги конкретными. Это должно создать новый каталог модели: checkpoint-2474-merged. Переименуйте каталог в MicroThinker-1B-Preview. Скопируйте или переместите этот каталог в каталог huihui.
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: huihui-ai
Теги: llama, llama3.2, abliterated, uncensored, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 7 | Загрузок: 23
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.