Tenete-8M
Tenete-8M — это модель с восемью миллионами параметров, обученная на пятистах семидесяти семи миллионах токенов. Хотя он не...
Tenete-8M — это модель с восемью миллионами параметров, обученная на пятистах семидесяти семи миллионах токенов. Хотя он не...
Керхер-слияние Sicarius-Prototyping/ImpishLongtail12B и SuperbEmphasis/MN-12b-RP-Ink-RP-Longform, используемое в KansenSakura-Erosion-RP-12b. Само слияние заняло чертовски много времени, вероятно, не собираясь повторять подобные...
Основанная 9 марта 2001 года со штаб-квартирой в Цзинане, провинция Шаньдун, компания Century Innovation за последние два десятилетия...
Это объединение предварительно обученных языковых моделей, созданных с помощью mergekit. DeepSeek-R1-Distill-Llama-8B был объединен с небольшим весом в надежде...
ZeroXClem/Qwen2.5-7B-CelestialHarmony-1M — это специальная объединенная языковая модель, основанная на Qwen2.5-7B, с расширенными возможностями рассуждения, ролевой игры и работы...
Это объединение предварительно обученных языковых моделей, созданных с помощью mergekit. Эта модель была объединена с использованием метода слияния...
Этот репозиторий содержит файлы моделей формата GGUF для Orion-zhen/Qwen2.5-7B-Instruct-Uncensored. Файлы были квантованы с использованием машин, предоставленных TensorBlock, и...
Tülu3 — это ведущее семейство моделей обучения, предлагающее данные, код и рецепты с полностью открытым исходным кодом, призванные...
Это объединение предварительно обученных языковых моделей, созданных с помощью mergekit. В объединение были включены следующие модели: rombodawg/Rombos-LLM-V2.5-Qwen-7b Cran-May/TE-8.1...
Это объединение предварительно обученных языковых моделей, созданных с помощью mergekit. Эта модель была объединена с использованием метода объединения...