Мы выявили некоторые проблемы с обычными Квантами, использующими эти модели для игры с Xaberius-34B и полной реализации его возможностей. К сожалению, нам не удалось использовать ни одну из моделей TheBloke, похоже, это привело к некоторым нежелательным результатам. Представляем МОДЕЛЬ: XABERIUS 34B v1-BETA — экспериментальная модель 34B на базе LLaMa-Yi-34B, лучшая в своей серии. Прошел обучение по SFT, DPO и UNA (Unified Neural Alignment) на нескольких наборах данных. Сроки: 05 декабря 2023 г. Выпущена бета-версия v1. 08 декабря 2023 г. Оценка «РАБОТАЕТ» в течение 2 дней.. результатов пока нет. 09 декабря 2023 г. Оценка «ЗАВЕРШЕНА», подтверждая, что первое место** превосходит загрязненного и дисквалифицированного тигробота 🙂 Примечание: на выполнение тестов ушло 19 часов, интересно, что произошло в 48 часов, когда HF провел это один.. временный выпуск вручную, другие результаты??.. — Оценка 74,21. Превзошла бывшего лидера Tigerbot-70b-chat и заняла первое место в HuggingFace LeaderBoard: 8 декабря 2023 г. — Оценка 79,13 в MMLU, установив новый рекорд не только для 34B, но и для всех OpenSource LLM 🙂 Примечание: MMLU был очень твердым 79+ .. странно, мы углубимся в это на предмет неровностей 🙂 Усовершенствовано с помощью UNA: техника равномерного нейронного выравнивания (скоро выйдет статья). Что…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: fblgit
Теги: llama, UNA, juanako, cybertron, xaberius, model-index, text-generation-inference, endpoints_compatible
Лайков: 85 | Загрузок: 821
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.