phi-2-layla-v1
Phi-2, настроенный с помощью набора данных OpenHermes 2.5, оптимизирован для многоходового разговора и подражания персонажам. Набор данных был...
Phi-2, настроенный с помощью набора данных OpenHermes 2.5, оптимизирован для многоходового разговора и подражания персонажам. Набор данных был...
Модель для статьи «TruthX: облегчение галлюцинаций путем редактирования больших языковых моделей в правдивом пространстве». TruthX — это метод...
MobiLlama-08B — это модель малого языка с 0,8 миллиарда параметров. Он был обучен с использованием источников данных Amber...
!Reyna aloobun qwen4B — доработан Qwen/Qwen1.5-4B для выполнения различных задач CoT, включая рассуждение, ответы на вопросы в закрытой...
Обучается на Baichuan2-7B-Chat с выборкой данных belle sft, сопровождаемых чередованием отрывков из жвики. Токены отражения соответствуют исходной версии...
Эта модель представляет собой двойную квантованную версию jais-13b-chat от core42. Цель состоит в том, чтобы запустить модель на...
Memphis-scribe 3B — это доработка Memphis-CoT 3B для более творческих данных, которая сама по себе является доработкой StableLM...
KafkaLM 13b — это модель Llama2 13b, предварительно обученная на большом немецком наборе данных от Бьорна Плюстера и...
InternLM2 опубликовала в открытом доступе базовую модель с 7 миллиардами параметров и модель чата, адаптированную для практических сценариев....
Это объединенная модель https://huggingface.co/cognitivecomputations/dolphin-2_6-phi-2 и функции sft, вызывающей lora здесь. Набор данных sft — https://huggingface.co/datasets/Yhyu13/glaive-function-calling-v2-llama-factory-convert, который я преобразовал...