Llama-2-7b-chat-TruthX
Модель для статьи «TruthX: облегчение галлюцинаций путем редактирования больших языковых моделей в правдивом пространстве». TruthX — это метод...
Модель для статьи «TruthX: облегчение галлюцинаций путем редактирования больших языковых моделей в правдивом пространстве». TruthX — это метод...
Посмотреть страницу проекта: https://github.com/TencentARC/LLaMA-Pro MetaMath-Mistral-Pro полностью настроен на наборах данных MetaMathQA и основан на мощной модели Mistral-Pro. Модель...
Эта модель представляет собой версию mistralai/Mistral-7B-v0.1 с полными параметрами и точными настройками, обученную на наборе данных Neural-DPO, Metamathgsm8k...
Это карточка модели трансформера 🤗, которая была размещена на Хабе. Эта карточка модели была создана автоматически. — Разработано:...
Это японская языковая модель с 7B-параметрами, настроенная на новые наборы данных и построенная на основе базовой модели Japan...
Данная модель является второй контрольной точкой будущего проекта. Он способен выполнять функциональные вызовы, а также обладает сильными коммуникативными...
gemma-2b настроен для генерации текста на турецком языке. — Язык(и) (NLP): турецкий, английский. — Лицензия: Creative Commons Attribution...
Эта модель обучена на DeepSeek-Coder-6.7B-Instruct. Я использовал свой существующий набор данных Code-290k-ShareGPT для целей обучения. Он обучен примерно...
MobiLlama-08B — это модель малого языка с 0,8 миллиарда параметров. Он был обучен с использованием источников данных Amber...
Это модель gemma-2b, тщательно настроенная на наборе данных Open-Orca/SlimOrca-Dedup. Он не так хорош, как mlabonne/Gemmalpaca-2B. Gemmalpaca-2B превосходит gemma-2b,...