huihui-ai/MicroThinker-1B-Preview

MicroThinker-1B-Preview, новая модель, доработанная на основе удаленной модели huihui-ai/Llama-3.2-1B-Instruct, ориентированная на расширение возможностей рассуждения ИИ. В процессе тонкой настройки использовалось только 20 000 записей из каждого набора данных. Процесс SFT (контролируемая точная настройка) разделен на несколько этапов, и писать код не требуется. 1. Создайте среду. 3. Использовался только набор данных huihui-ai/QWQ-LONGCOT-500K (#20000), обучение проводилось в течение 1 эпохи: 4. Сохраните точно настроенную модель. После того, как вы закончите, введите выход, чтобы выйти. Замените указанные ниже каталоги конкретными. Это должно создать новый каталог модели: checkpoint-1237-merged. Скопируйте или переместите этот каталог в каталог huihui. 6. Комбинированное обучение с наборами данных huihui-ai/QWQ-LONGCOT-500K (#20000) и huihui-ai/LONGCOT-Refine (#20000), обучение для 1 эпохи: 7. Сохраните окончательную точно настроенную модель. После того, как вы закончите, введите выход, чтобы выйти. Замените указанные ниже каталоги конкретными. Это должно создать новый каталог модели: checkpoint-2474-merged. Переименуйте каталог в MicroThinker-1B-Preview. Скопируйте или переместите этот каталог в каталог huihui.

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: huihui-ai
Теги: llama, llama3.2, abliterated, uncensored, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 7 | Загрузок: 23

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

fhai50032/RolePlayLake-7B

mistralai/Devstral-Small-2507_gguf

01-ai/Yi-1.5-6B-Chat

SultanR/SmolTulu-1.7b-Instruct