granite-3.0-1b-a400m-base
Краткое описание модели: Granite-3.0-1B-A400M-Base — это языковая модель, предназначенная только для декодера и поддерживающая различные задачи преобразования текста...
Краткое описание модели: Granite-3.0-1B-A400M-Base — это языковая модель, предназначенная только для декодера и поддерживающая различные задачи преобразования текста...
Hercules-6.1-Llama-3.1-8B — это усовершенствованная языковая модель, созданная на основе Llama-3.1-8B. Он специально разработан, чтобы добиться успеха в выполнении...
Исходная модель: https://huggingface.co/dfurman/CalmeRys-78B-Orpo-v0.1 Некоторые из этих квантов (Q3KXL, Q4KL и т. д.) являются стандартным методом квантования, в котором вложения...
Это объединение предварительно обученных языковых моделей, созданных с помощью mergekit. Эта модель была объединена с использованием метода слияния...
Модель RP, Niitama 1.1 в качестве основы, почти заменена на одну из самых умных моделей 3.1 «Storm», затем...
Это объединение предварительно обученных языковых моделей, созданных с помощью mergekit. Эта модель была объединена с использованием метода слияния...
Сторниитова-8Б — это модель RP/Instruct, построенная на основе Llama-3.1-SuperNova-Lite, которая представляет собой дистиллированную версию параметра 405B Llama-3.1. Меняя...
Эта модель представляет собой слияние Trappu/Nemo-Picaro-12B, модели, обученной на моем собственном небольшом наборе данных, не содержащего синтетических данных,...
Original model: https://huggingface.co/tiiuae/falcon-mamba-7b Some of these quants (Q3KXL, Q4KL etc) are the standard quantization method with the embeddings...
Granite-8B-Code-Base-128K увеличивает длину контекста Granite-8B-Code-Base с 4 КБ до 128 КБ с непрерывным предварительным обучением с использованием исходных...