d-Qwen1.5-0.5B
Модель ученика после тонкой настройки улучшает производительность базовой модели по двум критериям: truefulqa и gsm8k. Это эксперимент по...
Модель ученика после тонкой настройки улучшает производительность базовой модели по двум критериям: truefulqa и gsm8k. Это эксперимент по...
Sailor — это набор открытых языковых моделей, адаптированных для Юго-Восточной Азии (ЮВА), с упором на такие языки, как...
Sailor — это набор открытых языковых моделей, адаптированных для Юго-Восточной Азии (ЮВА), с упором на такие языки, как...
!Reyna aloobun qwen4B — доработан Qwen/Qwen1.5-4B для выполнения различных задач CoT, включая рассуждение, ответы на вопросы в закрытой...
Qwen1.5 — это бета-версия Qwen2, языковой модели только для декодера на основе преобразователя, предварительно обученной на большом объеме...
Qwen1.5 — это бета-версия Qwen2, языковой модели только для декодера на основе преобразователя, предварительно обученной на большом объеме...
Первая модель объяснения и генерации кода, специализирующаяся на арабском языке, с открытым исходным кодом. AraCode-7B понимает, объясняет и...
— 🎯 Фокус: RAG, контроль качества документов, извлечение информации, построение графа знаний, обобщение — 🧠 Основная идея: тренируйте...
Qwen2.5-7B-Instruct-1M-Thinking-Claude-Gemini-GPT5.2-DISTILL Qwen2.5-7B-Instruct-1M, теперь с полной версией Claude Opus 4.5 High Reasoning, Gemini и Gpt5.2 (3 набора данных для...
InfraMind — это языковая модель с параметрами 0,5 млрд, настроенная для генерации инфраструктуры как кода (IaC) с использованием...