Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области LLM щедро поддерживается грантом от Андреессена Горовица (a16z). Эти файлы представляют собой файлы 4-битной модели GPTQ для Baichuan Llama 7B от Fire Balloon. Это результат квантования до 4 бит с использованием GPTQ-for-LLaMa. Эта модель представляет собой переработку модели Baichuan 7B компании Baichuan Inc. https://huggingface.co/baichuan-inc/baichuan-7B). Он содержит те же данные, но переписанные Fire Balloon в привычный формат Llama. 4-битные модели GPTQ для вывода на основе графического процессора. 2, 3, 4, 5, 6 и 8-битные модели GGML для вывода на основе процессора и графического процессора. * Неквантованная модель fp16 в формате pytorch, для вывода на основе графического процессора и для дальнейших преобразований. Убедитесь, что вы используете последнюю версию text-generation-webui. 1. Перейдите на вкладку «Модель». 2. В разделе «Загрузить пользовательскую модель или LoRA» введите TheBloke/baichuan-llama-7B-GPTQ. 3. Нажмите «Загрузить». 4. Начнется загрузка модели. По завершении появится сообщение «Готово». 5. В левом верхнем углу щелкните значок обновления рядом с надписью «Модель». 6. В раскрывающемся списке «Модель» выберите только что загруженную модель: baichuan-llama-7B-GPTQ 7. Модель автоматически загрузится и теперь готова к использованию! 8. Если хочешь…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: TheBloke
Теги: llama, zh, en, text-generation-inference, 4-bit, gptq
Лайков: 7 | Загрузок: 4
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.