Qwen2 — новая серия больших языковых моделей Qwen. Для Qwen2 мы выпускаем ряд базовых языковых моделей и языковых моделей с настройкой инструкций с диапазоном от 0,5 до 72 миллиардов параметров, включая модель «Смесь экспертов». Этот репозиторий содержит модель базового языка 7B Qwen2. По сравнению с современными языковыми моделями с открытым исходным кодом, включая ранее выпущенный Qwen1.5, Qwen2 в целом превзошел большинство моделей с открытым исходным кодом и продемонстрировал конкурентоспособность по сравнению с проприетарными моделями в ряде тестов, нацеленных на понимание языка, генерацию языка, многоязычные возможности, кодирование, математику, рассуждение и т. д. Для получения более подробной информации обратитесь к нашему блогу, GitHub и документации. Qwen2 — это серия языковых моделей, включающая языковые модели декодеров разных размеров. Для каждого размера мы выпускаем модель базового языка и согласованную модель чата. Он основан на архитектуре Transformer с активацией SwiGLU, смещением внимания QKV, вниманием к групповым запросам и т. д. Кроме того, у нас есть улучшенный токенизатор, адаптивный к нескольким естественным языкам и кодам. Код Qwen2 присутствует в последних трансформерах Hugging Face, и мы советуем вам установить…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: Qwen
Теги: qwen2, pretrained, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 171 | Загрузок: 64,846
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.