PetroGPT/WestSeverus-7B-DPO-v2

WestSeverus-7B-DPO-v2 — это модель семейства WestLake, обученная на WestSeverus-7B. Модель была обучена на нескольких наборах данных dpo и может хорошо работать при решении основных математических задач. WestSeverus-7B-DPO-v2 можно использовать в математике, химии, физике и даже в программировании для дальнейших исследований и справок. 1. Результаты тестов Nous Benchmark — AGIEval — GPT4All — Результаты TruthfulQA — BigBench 2. Таблица лидеров Open LLM — ARC — HellaSwag — MMLU — TruthfulQA — Winogrande — GSM8K 3. Таблица лидеров EvalPlus — HumanEval — HumanEvalPlus — MBPP — MBPPPlus 4. Формат подсказки 5. Квантованные модели 6. Благодарность WestSeverus-7B-DPO-v2 в настоящее время находится на вершине YALL — еще одной таблицы лидеров LLM, созданной CultriX, и превосходит его по показателям TruthfulQA и BigBench. WestSeverus-7B-DPO-v2 — одна из лучших моделей 7B в таблице лидеров Open LLM и превосходит ее по показателям TruthfulQA и GSM8K. WestSeverus-7B-DPO-v2 был обучен с использованием шаблонов подсказок ChatML с системными подсказками. Ниже приведен пример: GGUF: https://huggingface.co/TheBloke/WestSeverus-7B-DPO-GGUF GGUF: https://huggingface.co/s3nh/WestSeverus-7B-DPO-GGUF GPTQ: https://huggingface.co/TheBloke/WestSeverus-7B-DPO-GPTQ AWQ:…

Модальности:
Генерация текста

Задача: Генерация текста
Автор: PetroGPT
Теги: mistral, en, text-generation-inference, endpoints_compatible
Лайков: 8 | Загрузок: 25

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

AIDC-AI/Marco-Mini-Base

TheBloke/Mistral-Pygmalion-7B-GPTQ

MaziyarPanahi/gemma-2b-GGUF

Qwen/Qwen3-4B-SafeRL