Метка: qwen2

Генерация текста

aloobun/d-Qwen1.5-0.5B

Модель ученика после тонкой настройки улучшает производительность базовой модели по двум критериям: truefulqa и gsm8k. Это эксперимент по...

Генерация текста

sail/Sailor-1.8B-Chat

Sailor — это набор открытых языковых моделей, адаптированных для Юго-Восточной Азии (ЮВА), с упором на такие языки, как...

Генерация текста

sail/Sailor-4B

Sailor — это набор открытых языковых моделей, адаптированных для Юго-Восточной Азии (ЮВА), с упором на такие языки, как...

Генерация текста

aloobun/Reyna-CoT-4B-v0.1

!Reyna aloobun qwen4B — доработан Qwen/Qwen1.5-4B для выполнения различных задач CoT, включая рассуждение, ответы на вопросы в закрытой...

Генерация текста

Qwen/Qwen1.5-4B-Chat-GPTQ-Int4

Qwen1.5 — это бета-версия Qwen2, языковой модели только для декодера на основе преобразователя, предварительно обученной на большом объеме...

Генерация текста

Qwen/Qwen1.5-4B-Chat-GPTQ-Int8

Qwen1.5 — это бета-версия Qwen2, языковой модели только для декодера на основе преобразователя, предварительно обученной на большом объеме...

Генерация текста

rahimdzx/AraCode-7B-Full

Первая модель объяснения и генерации кода, специализирующаяся на арабском языке, с открытым исходным кодом. AraCode-7B понимает, объясняет и...

Генерация текста

bond005/meno-lite-0.1

— 🎯 Фокус: RAG, контроль качества документов, извлечение информации, построение графа знаний, обобщение — 🧠 Основная идея: тренируйте...

Генерация текста

DavidAU/Qwen2.5-7B-Instruct-1M-Thinking-Claude-Gemini-GPT5.2-DISTILL

Qwen2.5-7B-Instruct-1M-Thinking-Claude-Gemini-GPT5.2-DISTILL Qwen2.5-7B-Instruct-1M, теперь с полной версией Claude Opus 4.5 High Reasoning, Gemini и Gpt5.2 (3 набора данных для...

Генерация текста

srallabandi0225/inframind-0.5b-grpo

InfraMind — это языковая модель с параметрами 0,5 млрд, настроенная для генерации инфраструктуры как кода (IaC) с использованием...