jondurbin/airoboros-mpt-30b-gpt4-1p4-five-epochs

Это тест тонкой настройки qlora модели mpt-30b, с 5 эпохами. Модель, совместимая с qlora: https://huggingface.co/jondurbin/mpt-30b-qlora-совместимая Моя вилка qlora с поддержкой mpt-30b: https://github.com/jondurbin/qlora — требует добавления —mpt True для моделей на основе mpt — использует —numtrainepochs вместо —maxsteps` — использует формат приглашения airoboros (в основном 1:1 с викуньей), а не alpaca и ожидает входной файл в формате JSONL с «инструкцией» и «ответом». Я думаю, что есть ошибка в накоплении градиента, поэтому, если вы попробуете это, возможно, установите шаги накопления градиента на 1. Подробности обучения см. в карточке модели, совместимой с mpt-30b-qlora. К сожалению, после разовых испытаний это не кажется таким качественным, как версии llama-33b, но у меня нет четкого ответа, почему. Возможно, есть меньше прямых слоев, которые можно настроить? В основном это расширение предыдущей серии gpt-4, но это первая серия, в основе которой лежит mpt-30b, а также несколько дополнений: исправленные (+ дополнительные примеры) примеры кодирования многосимвольных многоповоротных диалогов на 10 языках из набора данных Rosettacode.org благодаря Майку, также известному как kryptkpr:…

Модальности:
Генерация текста

Задача: Генерация текста
Автор: jondurbin
Теги: mpt, custom_code, text-generation-inference, endpoints_compatible
Лайков: 7 | Загрузок: 13

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

Epiculous/Crimson_Dawn-V0.1

Arc53/docsgpt-40b-falcon

mradermacher/Huihui-Qwen3.6-35B-A3B-Claude-4.7-Opus-abliterated-i1-GGUF

ArliAI/QwQ-32B-ArliAI-RpR-v4