internlm/internlm2_5-20b-chat-gguf

Модель internlm25-20b-chat в формате GGUF может использоваться llama.cpp, очень популярной платформой с открытым исходным кодом для вывода модели большого языка (LLM), на различных аппаратных платформах, как локально, так и в облаке. Этот репозиторий предлагает модели internlm25-20b-chat в формате GGUF как с половинной точностью, так и с различными низкобитными квантованными версиями, включая q50, q5km, q6k и q80`. В последующих разделах мы сначала представим процедуру установки, а затем объясним процесс загрузки модели. И, наконец, мы проиллюстрируем методы вывода моделей и развертывания сервисов на конкретных примерах. Мы рекомендуем собирать llama.cpp из исходного кода. В следующем фрагменте кода представлен пример платформы Linux CUDA. Инструкции для других платформ можно найти в официальном руководстве. Все созданные цели можно найти в подкаталоге build/bin. В следующих разделах мы предполагаем, что рабочий каталог находится в корневом каталоге llama.cpp. Во введении мы упомянули, что этот репозиторий включает в себя несколько моделей с разным уровнем вычислительной точности. Вы можете скачать подходящую модель на основе вашего…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: internlm
Теги: gguf, chat, en, endpoints_compatible, conversational
Лайков: 39 | Загрузок: 209

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Tensoic/TinyLlama-1.1B-3T-openhermes

Это версия Tiny Llama с точной настройкой инструкций в наборе данных openhermes @Teknium1. «Проект TinyLlama направлен на предварительное...

Генерация текста

RicardoLee/Llama2-chat-7B-Chinese-withCode3W-LoRA

目前坊间一直流传,代码数据训练能极大的提升模型的COT能力。因此,本项Лучший подарок для BELLE, 50 дюймов, SFT, для SFT, для SFT.外，还加入了code-review-instruct-critique-revision-python数据集以及部分网上爬取的逻辑推理问答数据。该模型使用Llama2-chat-7B 作为基底模型,使用带embedding和LM Head 的LoRA方式进行训练。模型已完成参数合并，可直接使用。也可以手动将sftloramodel 同Llama2-chat 7B进行合并。 Основная цель...

Генерация текста

guardrail/llama-2-7b-guanaco-instruct-sharded

Модель, настроенная с точностью до 4 бит с использованием QLoRA на timdettmers/openassistant-guanaco и сегментированная для использования в бесплатном...

Генерация текста

TheBloke/llama2_70b_chat_uncensored-GPTQ

Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области...