MetaMath-Mistral-Pro
Посмотреть страницу проекта: https://github.com/TencentARC/LLaMA-Pro MetaMath-Mistral-Pro полностью настроен на наборах данных MetaMathQA и основан на мощной модели Mistral-Pro. Модель...
Посмотреть страницу проекта: https://github.com/TencentARC/LLaMA-Pro MetaMath-Mistral-Pro полностью настроен на наборах данных MetaMathQA и основан на мощной модели Mistral-Pro. Модель...
Эта модель представляет собой версию mistralai/Mistral-7B-v0.1 с полными параметрами и точными настройками, обученную на наборе данных Neural-DPO, Metamathgsm8k...
Это карточка модели трансформера 🤗, которая была размещена на Хабе. Эта карточка модели была создана автоматически. — Разработано:...
Это японская языковая модель с 7B-параметрами, настроенная на новые наборы данных и построенная на основе базовой модели Japan...
Данная модель является второй контрольной точкой будущего проекта. Он способен выполнять функциональные вызовы, а также обладает сильными коммуникативными...
gemma-2b настроен для генерации текста на турецком языке. — Язык(и) (NLP): турецкий, английский. — Лицензия: Creative Commons Attribution...
Эта модель обучена на DeepSeek-Coder-6.7B-Instruct. Я использовал свой существующий набор данных Code-290k-ShareGPT для целей обучения. Он обучен примерно...
MobiLlama-08B — это модель малого языка с 0,8 миллиарда параметров. Он был обучен с использованием источников данных Amber...
Это модель gemma-2b, тщательно настроенная на наборе данных Open-Orca/SlimOrca-Dedup. Он не так хорош, как mlabonne/Gemmalpaca-2B. Gemmalpaca-2B превосходит gemma-2b,...
Gemma-Wukong-2b — это усовершенствованная версия оригинальной Gemma 2b, разработанная Google Deepmind и другими командами. Эта модель была обучена...