anthracite-org/magnum-v2.5-12b-kto-gguf - Каталог нейросетей
Генерация текста

anthracite-org/magnum-v2.5-12b-kto-gguf

Добавлено:
anthracite-org/magnum-v2.5-12b-kto-gguf

v2.5 КТО — экспериментальная версия; мы тестируем гибридную стратегию обучения с подкреплением KTO + DPOP, используя отклоненные данные, выбранные из исходной модели как «отклоненные». Для «выбранного» мы используем данные из исходного набора данных точной настройки как «выбранного». Это было сделано на ограниченной части данных, следующих за инструкциями; в будущем мы планируем увеличить объем данных KTO для лучшего обобщения. Это пятая модель в серии, призванной воспроизвести прозаическое качество моделей Claude 3, в частности Sonnet и Opus. Эта модель доработана поверх anthracite-org/magnum-12b-v2. Модель была настроена с учетом форматирования ChatML. Типичный входной файл будет выглядеть следующим образом: — Набор данных Stheno (отфильтрованный) — kalomaze/OpusInstruct25k — Nopm/OpusWritingStruct — Gryphe/Sonnet3.5-SlimOrcaDedupCleaned (подмножество ~16 тысяч строк) — kalomaze/OpusInstruct_3k Эта модель является результатом командной работы, и заслуга принадлежит всем членам Anthracite.

Модальности:
Генерация текста

Области применения:
Диалог / чат


Задача: Генерация текста
Автор: anthracite-org
Теги: gguf, chat, en, fr, de, es, it, pt
Лайков: 42  |  Загрузок: 434

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.