Метка: trl

Генерация текста

Praneeth/code-gemma-2b-it

Code-Gemma была точно настроена (1 тыс. шагов) на наборе данных CodeAlpaca-20k с использованием библиотеки unsloth для улучшения модели...

Генерация текста

Mabeck/Heidrun-Mistral-7B-chat

Heidrun-Mistral-7B-chat — это модель чата, основанная на базе Heidrun-Mistral-7B, доработанная на датском OpenHermes и skoleGPT для формата инструкций/чата....

Генерация текста

fhai50032/RolePlayLake-7B-Toxic

— Разработчик: fhai50032 — Лицензия: apache-2.0 — Доработано на основе модели: fhai50032/RolePlayLake-7B Подробнее Без цензуры, без каких-либо подсказок;...

Генерация текста

bartowski/Tesslate_Tessa-T1-32B-GGUF

Исходная модель: https://huggingface.co/Tesslate/Tessa-T1-32B. Запускайте их напрямую с помощью llama.cpp или любого другого проекта на основе llama.cpp. Некоторые из...

Генерация текста

yasserrmd/Text2SQL-1.5B

Text2SQL-1.5B — это мощная модель естественного языка SQL, предназначенная для преобразования пользовательских запросов в структурированные операторы SQL. Он...

Генерация текста

Azzedde/llama3.1-8b-text2cypher

Описание модели Это карточка модели Llama3.1-8B-Cypher, доработанной версии Meta Llama-3.1-8B, оптимизированной для генерации запросов Cypher на основе ввода...

Генерация текста

yasserrmd/Coder-GRPO-3B

Разработчик: yasserrmd Базовая модель: Qwen/Qwen2.5-3B-Instruct Цель: Анализ и генерация кода с помощью коротких, правильных программ и кратких объяснений....

Генерация текста

abhi9ab/DeepSeek-R1-Distill-Llama-8B-finance-v1

— Разработчик: abhi9ab — Лицензия: apache-2.0 — Точная настройка на основе модели: unsloth/DeepSeek-R1-Distill-Llama-8B Эта модель ламы была обучена...

Генерация текста

prithivMLmods/Calcium-Opus-14B-Elite2-R1

Calcium-Opus-14B-Elite2-R1 основан на архитектуре модальности Qwen 2.5 14B, предназначенной для расширения возможностей рассуждения моделей с 14B параметрами. Он...

Генерация текста

DebateLabKIT/Llama-3.1-Argunaut-1-8B-SFT

Эта модель представляет собой доработанную версию мета-ламы/Llama-3.1-8B-Instruct. Он был обучен с использованием TRL. 🤖 Ассистент Да, я знаком...