RuadaptQwen2.5-14B-R1-distill-preview-v1-GGUF
Инструктивная версия адаптированной на русском языке модели deepseek-ai/DeepSeek-R1-Distill-Qwen-14B. В модели был заменен токенизатор, затем произведено дообучение (продолжение предварительного...
Инструктивная версия адаптированной на русском языке модели deepseek-ai/DeepSeek-R1-Distill-Qwen-14B. В модели был заменен токенизатор, затем произведено дообучение (продолжение предварительного...
Русская инструктивная версия, адаптированная на языке модели Qwen2.5-14B. В модели был заменен токенизатор, затем произведено дообучение (продолжение предварительного...
Русская инструктивная версия, адаптированная на языке модели Qwen2.5-7B. В модели был заменен токенизатор, затем произведено дообучение (Продолжение предварительного...
Вслед за CrimsonDawn-v0.2 у нас есть AzureDusk-v0.2! Тренируясь на Мистраль-Немо-Базе-2407, на этот раз я добавил значительно больше данных,...
Базовый Вихрь 5той версии (мистраль) обучен переводу инструкций и ответов GPT-4 и улучшен с помощью ORPO на нашем...
Долили сильно больше данных в sft, теперь стабильнее работает json и multiturn, слегка подточили параметры претрена модели. Добавлено...
— Это квантованная версия IlyaGusev/saigallama38b, созданная с использованием llama.cpp v2: — версия кода набора данных d0d123dd221e10bb2a3383bcb1c6e4efe1b4a28a — ссылка...
!logo-gembo.png Это мое первое «серьезное» (с практическим применением) экспериментальное слияние. Судите строго. В основном создан для РП, но...
Языковая модель для армянского языка. Модель имеет 1,3В параметров, как можно догадаться по названию. Армянский принадлежит к индоевропейской...
Данная модель создана для имитации личности в диалоге. Подробнее тут 1. Ты парень, пилот самолета. Увлекаешься дайвингом. Собираешь...