TheBloke/h2ogpt-gm-oasst1-en-2048-falcon-40b-v2-GPTQ

Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области LLM щедро поддерживается грантом от Андреессена Горовица (a16z). Эти файлы представляют собой файлы 4-битной модели GPTQ для GPT-GM-OASST1-Falcon 40B v2 от H2O. 4-битные модели GPTQ для вывода на основе графического процессора. 2, 3, 4, 5, 6 и 8-битные модели GGML для вывода на основе процессора и графического процессора. * Неквантованная модель fp16 в формате pytorch, для вывода на основе графического процессора и для дальнейших преобразований. Обратите внимание, что это экспериментальная модель GPTQ. В настоящее время его поддержка весьма ограничена. Также ожидается, что это будет ОЧЕНЬ МЕДЛЕННО. На данный момент это неизбежно, но над этим ведется работа. 1. Запустите text-generation-webui. 2. Перейдите на вкладку «Модель». 3. Снимите флажок «Автозагрузка модели». 4. В разделе «Загрузить пользовательскую модель или LoRA» введите TheBloke/h2ogpt-gm-oasst1-en-2048-falcon-40b-v2-GPTQ. 5. Нажмите «Загрузить». 6. Подождите, пока появится сообщение об окончании загрузки. 7. Щелкните значок «Обновить» рядом с надписью «Модель» в левом верхнем углу. 8. В раскрывающемся списке «Модель» выберите только что загруженную модель: TheBloke/h2ogpt-gm-oasst1-en-2048-falcon-40b-v2-GPTQ. 9. Убедитесь, что для параметра Loader установлено значение AutoGPTQ. Эта модель не будет работать с ExLlama или GPTQ-for-LLaMa. 10. Отметьте «Доверять удаленный код», а затем «Сохранить…».

Модальности:
Генерация текста

Задача: Генерация текста
Автор: TheBloke
Теги: RefinedWeb, gpt, llm, large language model, h2o-llmstudio, custom_code, en, text-generation-inference
Лайков: 8 | Загрузок: 13

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Bllossom/llama-3.2-Korean-Bllossom-3B

[2024.12.06] 훨씬 강력한 최신 Blossom-AICA-5B로 업데이트 되었습니다 링크 [2024.10.08] Blossom-3B 모델이 최초 업데이트 되었습니다. — 임경태 (Кён Тэ...

Генерация текста

abeja/ABEJA-Qwen3-14B-Agentic-256k-v0.1

ABEJA-Qwen3-14B-Agentic-256k-v0.1は、Alibaba社の開発したQwen3-14Bに対して追加学習を行ったものです。エージェントとして活用できるようにロングコンテキスト性能とПланирование/использование инструментов などの Agenticな能力の向上を狙ったもので、コンテキスト長として256kまで対応しつつ、思考とツール利用のループが出来ることが主な特徴のモデルです。 https://tech-blog.abeja.asia/entry/geniac3-qwen3-agentic-modelベースモデルであるQwen3-14Bと同様に、パラメータとしては、Temperature=0.6, TopP=0.95, TopK=20, MinP=0 及び жадный декодированиеを使わないことを推奨しています。 > Для режима мышления используйте Температура=0,6, TopP=0,95,...

Генерация текста

DiscoResearch/mixtral-7b-8expert

Это предварительная реализация HuggingFace недавно выпущенной модели MoE от MistralAi. Обязательно загрузите файл с параметромtrustremotecode=True. Спасибо @dzhulgkov за...

Генерация текста

CohereLabs/c4ai-command-r7b-arabic-02-2025

Cohere Labs Command R7B Arab — это открытая версия для исследования весов пользовательской модели с 7 миллиардами параметров...