Tülu3 — это ведущее семейство моделей обучения, предлагающее данные, код и рецепты с полностью открытым исходным кодом, призванные служить всеобъемлющим руководством по современным методам постобучения. Tülu3 предназначен для решения самых современных задач, помимо чата, таких как MATH, GSM8K и IFEval. — Тип модели: модель, обученная на общедоступных, синтетических и созданных человеком наборах данных. — Язык(и) (NLP): преимущественно английский. — Лицензия: Лицензионное соглашение сообщества Llama 3.1. — Доработано на основе модели: Meta-llama/Llama-3.1-405B. — Репозиторий обучения: https://github.com/allenai/open-instruct. — Репозиторий Eval: https://github.com/allenai/olmes. — Бумага: https://arxiv.org/abs/2411.15124 — Демо: https://playground.allenai.org/ Чтобы загрузить модель с помощью HuggingFace, используйте следующий фрагмент: Обратите внимание, что, учитывая длинный шаблон чата Llama, вы можете использовать —maxmodellen=8192. Он также встроен в токенайзер для tokenizer.applychattemplate. Модель не обучалась с учетом конкретной системной подсказки. Модели Tülu3 проходят ограниченное обучение технике безопасности, но не развертываются автоматически с внутриконтурной фильтрацией ответов, как ChatGPT, поэтому модель…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: allenai
Теги: llama, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 11 | Загрузок: 832
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.