Целью Xwin-LM является разработка технологий согласования с открытым исходным кодом для больших языковых моделей, включая контролируемую точную настройку (SFT), модели вознаграждения (RM), отказную выборку, обучение с подкреплением на основе обратной связи с человеком (RLHF) и т. д. Наш первый выпуск, основанный на базовых моделях Llama2, занял ТОП-1 на AlpacaEval. Примечательно, что он первым превзошел GPT-4 в этом тесте. Проект будет постоянно обновляться. — 💥 [сентябрь 2023 г.] Мы выпустили Xwin-LM-70B-V0.1, который достиг показателя победы над Davinci-003 в 95,57% в тесте AlpacaEval и занял первое место в рейтинге AlpacaEval. Это была ПЕРВАЯ модель, превзошедшая GPT-4 на AlpacaEval. Также обратите внимание на его винрейт против. ГПТ-4 составляет 60,61. — 🔍 [сентябрь 2023 г.] RLHF играет решающую роль в высокой производительности выпуска Xwin-LM-V0.1! — 💥 [сентябрь 2023 г.] Мы выпустили Xwin-LM-13B-V0.1, который достиг показателя побед 91,76% на AlpacaEval и занял первое место среди всех моделей 13B. — 💥 [сентябрь 2023 г.] Мы выпустили Xwin-LM-7B-V0.1, показатель побед которого составил 87,82% на AlpacaEval, заняв первое место среди всех моделей 7B. В таблице ниже показаны результаты Xwin-LM на AlpacaEval, где оценивается его победа над Text-Davinci-003 по 805 вопросам. Чтобы предоставить комплексное…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: Xwin-LM
Теги: llama, text-generation-inference, endpoints_compatible
Лайков: 78 | Загрузок: 810
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.