allenai/Llama-3.1-Tulu-3-405B

Tülu 3 — это ведущее семейство моделей обучения, предлагающее пакет после обучения с полностью открытыми исходными данными, кодом и рецептами, призванными служить всеобъемлющим руководством по современным методам. Это один из шагов более масштабного процесса обучения моделей с полностью открытым исходным кодом, таких как наши модели OLMo. Tülu 3 предназначен для решения самых современных задач, помимо чата, таких как MATH, GSM8K и IFEval. — Тип модели: модель, обученная на общедоступных, синтетических и созданных человеком наборах данных. — Язык(и) (NLP): преимущественно английский. — Лицензия: Лицензионное соглашение сообщества Llama 3.1. — Точно настроено на основе модели: allenai/Llama-3.1-Tulu-3-405B-DPO. — Учебный репозиторий: https://github.com/allenai/open-instruct. — Оценочный репозиторий: https://github.com/allenai/olmes. — Бумага: https://arxiv.org/abs/2411.15124 — Демо: https://playground.allenai.org/ Чтобы загрузить модель с помощью HuggingFace, используйте следующий фрагмент: Обратите внимание, что, учитывая длинный шаблон чата Llama, вы можете использовать —maxmodellen=8192. Он также встроен в токенайзер для tokenizer.applychattemplate. Модель не обучалась с учетом конкретной системной подсказки. Модели Tülu3 имеют…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: allenai
Теги: llama, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 111 | Загрузок: 72

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Qwen/Qwen3-14B-GGUF

nisten/Biggie-SmoLlm-0.4B

unsloth/Qwen2.5-Coder-3B-Instruct-bnb-4bit

WiroAI/OpenR1-Qwen-7B-Turkish