Это квантованная версия Qwen/Qwen2.5-Coder-7B-Instruct, основанная на обновленных весах (от 6 ноября 2024 г.) и созданная с использованием llama.cpp. Qwen2.5-Coder — это последняя серия кодовых больших языковых моделей Qwen (ранее известных как CodeQwen). Для Qwen2.5-Coder мы выпускаем три базовые языковые модели и языковые модели, настроенные на инструкции: 1,5, 7 и 32 (скоро) миллиарда параметров. Qwen2.5-Coder вносит следующие улучшения в CodeQwen1.5: — Значительные улучшения в генерации кода, его обосновании и исправлении. Основываясь на мощном Qwen2.5, мы увеличиваем количество обучающих токенов до 5,5 триллионов, включая исходный код, текстовый код, синтетические данные и т. д. — более полную основу для реальных приложений, таких как агенты кода. Не только расширяя возможности кодирования, но и сохраняя свои сильные стороны в математике и общих компетенциях. — Поддержка длинного контекста до 128 тыс. токенов. Этот репозиторий содержит настроенную по инструкциям модель 7B Qwen2.5-Coder, которая имеет следующие функции: — Тип: причинные языковые модели — Этап обучения: предварительное обучение и постобучение — Архитектура: преобразователи с RoPE, SwiGLU, RMSNorm и смещением QKV внимания — Количество параметров:…
Модальности:
Генерация текста
Области применения:
Генерация кода Диалог / чат Следование инструкциям
Задача: Генерация текста
Автор: QuantFactory
Теги: gguf, code, codeqwen, chat, qwen, qwen-coder, en, endpoints_compatible
Лайков: 7 | Загрузок: 1,619
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.