Intel/neural-chat-7b-v3-1

Эта модель представляет собой точно настроенный параметр LLM 7B на процессоре Intel Gaudi 2 из mistralai/Mistral-7B-v0.1 в наборе данных с открытым исходным кодом Open-Orca/SlimOrca. Модель была согласована с использованием метода прямой оптимизации производительности (DPO) с Intel/orcadpopairs. Дополнительную информацию см. в статье Medium «Практика контролируемой точной настройки и оптимизации прямых предпочтений в Intel Gaudi2». Длина контекста для этой модели: 8192 токена (так же, как https://huggingface.co/mistralai/Mistral-7B-v0.1). Во время обучения использовались следующие гиперпараметры: — скорость обучения: 1e-04 — trainbatchsize: 1 — evalbatchsize: 2 — начальное число: 42 — распределенный тип: multi-HPU — numdevices: 8 -gradientaccumulationsteps: 8 — totaltrainbatchsize: 64 — totalevalbatchsize: 8 — оптимизатор: Адам с betas=(0,9,0,999) и epsilon=1e-08 — lrschedulertype: cosine — lrschedulerwarmupratio: 0,03 — num_epochs: 2.0 Вот пример кода для воспроизведения модели: пример кода GitHub. Вот документация для воспроизведения построения модели: Для проведения эксперимента мы выбираем последнюю предварительно обученную модель mistralai/Mistral-7B-v0.1 и набор данных с открытым исходным кодом Open-Orca/SlimOrca. В приведенном ниже скрипте для запуска используется DeepSpeed Zero2…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: Intel
Теги: mistral, LLMs, Intel, conversational, en, model-index, text-generation-inference, endpoints_compatible
Лайков: 548 | Загрузок: 8,104

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

SteelStorage/Aethora-7b-v1

noctrex/GLM-4.7-Flash-Claude-Opus-4.5-High-Reasoning-Distill

rombodawg/Rombos-LLM-V2.5-Qwen-7b

DavidAU/MN-CaptainErisNebula-Chimera-v1.1-THINKING-ClaudeOpus4.5-12B-heretic-uncensored