TheBloke/orca_mini_13B-GPTQ

Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области LLM щедро поддерживается грантом от Андреессена Горовица (a16z). Эти файлы представляют собой 4-битные файлы моделей GPTQ для Orca Mini 13B Панкаджа Матура. Это результат квантования до 4 бит с использованием GPTQ-for-LLaMa. 4-битные модели GPTQ для вывода на основе графического процессора. 2, 3, 4, 5, 6 и 8-битные модели GGML для вывода на основе процессора и графического процессора. * Неквантованная модель fp16 в формате pytorch, для вывода на основе графического процессора и для дальнейших преобразований. Убедитесь, что вы используете последнюю версию text-generation-webui. Настоятельно рекомендуется использовать программу установки в один клик text-generation-webui, если вы не знаете, как выполнить установку вручную. 1. Откройте вкладку Модель. 2. В разделе «Загрузить пользовательскую модель или LoRA» введите TheBloke/orcamini13B-GPTQ. 3. Нажмите «Загрузить». 4. Начнется загрузка модели. По завершении появится сообщение «Готово». 5. В левом верхнем углу щелкните значок обновления рядом с надписью «Модель». 6. В раскрывающемся списке «Модель» выберите только что загруженную модель: orcamini13B-GPTQ. 7. Модель автоматически загрузится и теперь готова к использованию! 8. Если вам нужны какие-либо пользовательские настройки, установите их, а затем нажмите «Сохранить настройки для этой модели», а затем «Обновить…».

Модальности:
Генерация текста

Задача: Генерация текста
Автор: TheBloke
Теги: llama, en, text-generation-inference, 4-bit, gptq
Лайков: 44 | Загрузок: 828

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

bhenrym14/airoboros-33b-gpt4-1.4.1-NTK-16384-GPTQ

AnatoliiPotapov/T-lite-0.1

prithivMLmods/Phi-4-QwQ

Qwen/Qwen2-1.5B