Qwen/Qwen2-72B-Instruct-GPTQ-Int4

Qwen2 — новая серия больших языковых моделей Qwen. Для Qwen2 мы выпускаем ряд базовых языковых моделей и языковых моделей с настройкой инструкций с диапазоном от 0,5 до 72 миллиардов параметров, включая модель «Смесь экспертов». Этот репозиторий содержит настроенную по инструкциям модель 72B Qwen2. По сравнению с современными языковыми моделями с открытым исходным кодом, включая ранее выпущенную Qwen1.5, Qwen2 в целом превзошел большинство моделей с открытым исходным кодом и продемонстрировал конкурентоспособность по сравнению с проприетарными моделями в ряде тестов, ориентированных на понимание языка, генерацию языка, многоязычные возможности, кодирование, математику, рассуждение и т. д. Qwen2-72B-Instruct-GPTQ-Int4 поддерживает длину контекста до 131 072 токенов, что позволяет обрабатывать обширные входы. Пожалуйста, обратитесь к этому разделу за подробными инструкциями по развертыванию Qwen2 для обработки длинных текстов. Для получения более подробной информации обратитесь к нашему блогу, GitHub и документации. Qwen2 — это серия языковых моделей, включающая языковые модели декодеров разных размеров. Для каждого размера мы выпускаем модель базового языка и согласованную модель чата. Он основан на архитектуре Transformer с активацией SwiGLU,…

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям

Задача: Генерация текста
Автор: Qwen
Теги: qwen2, chat, conversational, en, text-generation-inference, endpoints_compatible, 4-bit, gptq
Лайков: 33 | Загрузок: 195

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

allenai/tulu-2-dpo-7b

Sao10K/32B-Qwen2.5-Kunou-v1

mucai/vip-llava-7b

abacaj/starcoderbase-1b-sft