Метка: evaluation

Генерация текста

ContextualAI/LMUnit-qwen2.5-72b

LMUnit — это современная языковая модель, оптимизированная для оценки модульных тестов естественного языка. Он принимает три входных данных:...

Генерация текста

ContextualAI/ctx-bird-reward-250121

Модель вознаграждения Contextual-SQL — это оценочный компонент системы Contextual-SQL, которая заняла первое место в таблице лидеров тестов BIRD...

Генерация текста

bartowski/Selene-1-Mini-Llama-3.1-8B-GGUF

Исходная модель: https://huggingface.co/AtlaAI/Selene-1-Mini-Llama-3.1-8B. Запускайте их напрямую с помощью llama.cpp или любого другого проекта на основе llama.cpp. Некоторые из...

Генерация текста

AGI-Eval/UNO-Scorer-Qwen3-14B

UNO-Scorer — это легкая, но высокоточная модель оценки на основе LLM, предназначенная для эффективной автоматизации оценки больших мультимодальных...

Генерация текста

AtlaAI/Selene-1-Llama-3.3-70B

🌐 Сообщение в блоге | 📄 Технический отчет | 💻 Кулинарные книги | 👀 Агент Atla оценивает @keyframes...

Генерация текста

AtlaAI/Selene-1-Mini-Llama-3.1-8B-Q4_K_M-GGUF

🛝 Детская площадка | 📄 Технический отчет | 💻 GitHub | 👀 Агент Atla оценивает @keyframes Rainbow {...

Генерация текста

sorry-bench/ft-mistral-7b-instruct-v0.2-sorry-bench-202406

кнопка {//margin: Calc(20vw/100); / маржа: 0,5em; отступ слева: Calc(40vw / 100); отступ справа: Calc(40vw / 100); отступ-дно: Calc...

Генерация текста

flowaicom/Flow-Judge-v0.1-GGUF

— Исходная модель: Flow-Judge-v0.1 — Коллекция моделей: модели Flow-Judge-v0.1 — Технический отчет: Flow Judge: открытая модель на малом...

Генерация текста

PatronusAI/Llama-3-Patronus-Lynx-8B-Instruct-v1.1

Lynx — это модель оценки галлюцинаций с открытым исходным кодом. Patronus-Lynx-8B-Instruct-v1.1 был обучен на различных наборах данных, включая...

Генерация текста

llm-blender/PairRM-hf

Это версия llm-blender/PairRM, совместимая с обнимающим лицом, которую можно загрузить непосредственно с помощью DebertaV2PairRM: Вы также можете скопировать...