WestSeverus-7B-DPO-v2 — это модель семейства WestLake, обученная на WestSeverus-7B. Модель была обучена на нескольких наборах данных dpo и может хорошо работать при решении основных математических задач. WestSeverus-7B-DPO-v2 можно использовать в математике, химии, физике и даже в программировании для дальнейших исследований и справок. 1. Результаты тестов Nous Benchmark — AGIEval — GPT4All — Результаты TruthfulQA — BigBench 2. Таблица лидеров Open LLM — ARC — HellaSwag — MMLU — TruthfulQA — Winogrande — GSM8K 3. Таблица лидеров EvalPlus — HumanEval — HumanEvalPlus — MBPP — MBPPPlus 4. Формат подсказки 5. Квантованные модели 6. Благодарность WestSeverus-7B-DPO-v2 в настоящее время находится на вершине YALL — еще одной таблицы лидеров LLM, созданной CultriX, и превосходит его по показателям TruthfulQA и BigBench. WestSeverus-7B-DPO-v2 — одна из лучших моделей 7B в таблице лидеров Open LLM и превосходит ее по показателям TruthfulQA и GSM8K. WestSeverus-7B-DPO-v2 был обучен с использованием шаблонов подсказок ChatML с системными подсказками. Ниже приведен пример: GGUF: https://huggingface.co/TheBloke/WestSeverus-7B-DPO-GGUF GGUF: https://huggingface.co/s3nh/WestSeverus-7B-DPO-GGUF GPTQ: https://huggingface.co/TheBloke/WestSeverus-7B-DPO-GPTQ AWQ:…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: PetroGPT
Теги: mistral, en, text-generation-inference, endpoints_compatible
Лайков: 8 | Загрузок: 25
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.