allenai/Llama-3.1-Tulu-3-405B-SFT

Tülu3 — это ведущее семейство моделей обучения, предлагающее данные, код и рецепты с полностью открытым исходным кодом, призванные служить всеобъемлющим руководством по современным методам постобучения. Tülu3 предназначен для решения самых современных задач, помимо чата, таких как MATH, GSM8K и IFEval. — Тип модели: модель, обученная на общедоступных, синтетических и созданных человеком наборах данных. — Язык(и) (NLP): преимущественно английский. — Лицензия: Лицензионное соглашение сообщества Llama 3.1. — Доработано на основе модели: Meta-llama/Llama-3.1-405B. — Репозиторий обучения: https://github.com/allenai/open-instruct. — Репозиторий Eval: https://github.com/allenai/olmes. — Бумага: https://arxiv.org/abs/2411.15124 — Демо: https://playground.allenai.org/ Чтобы загрузить модель с помощью HuggingFace, используйте следующий фрагмент: Обратите внимание, что, учитывая длинный шаблон чата Llama, вы можете использовать —maxmodellen=8192. Он также встроен в токенайзер для tokenizer.applychattemplate. Модель не обучалась с учетом конкретной системной подсказки. Модели Tülu3 проходят ограниченное обучение технике безопасности, но не развертываются автоматически с внутриконтурной фильтрацией ответов, как ChatGPT, поэтому модель…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: allenai
Теги: llama, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 11 | Загрузок: 832

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

jondurbin/airoboros-70b-3.3

OuteAI/Lite-Oute-1-65M

hjhj3168/Llama-3-8b-Orthogonalized-exl2

ibm-granite/granite-4.1-3b-fp8