Tülu 3 — это ведущее семейство моделей обучения, предлагающее пакет после обучения с полностью открытыми исходными данными, кодом и рецептами, призванными служить всеобъемлющим руководством по современным методам. Это один из шагов более масштабного процесса обучения моделей с полностью открытым исходным кодом, таких как наши модели OLMo. Tülu 3 предназначен для решения самых современных задач, помимо чата, таких как MATH, GSM8K и IFEval. — Тип модели: модель, обученная на общедоступных, синтетических и созданных человеком наборах данных. — Язык(и) (NLP): преимущественно английский. — Лицензия: Лицензионное соглашение сообщества Llama 3.1. — Точно настроено на основе модели: allenai/Llama-3.1-Tulu-3-405B-DPO. — Учебный репозиторий: https://github.com/allenai/open-instruct. — Оценочный репозиторий: https://github.com/allenai/olmes. — Бумага: https://arxiv.org/abs/2411.15124 — Демо: https://playground.allenai.org/ Чтобы загрузить модель с помощью HuggingFace, используйте следующий фрагмент: Обратите внимание, что, учитывая длинный шаблон чата Llama, вы можете использовать —maxmodellen=8192. Он также встроен в токенайзер для tokenizer.applychattemplate. Модель не обучалась с учетом конкретной системной подсказки. Модели Tülu3 имеют…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: allenai
Теги: llama, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 111 | Загрузок: 72
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.