akjindal53244/Arithmo-Mistral-7B - Каталог нейросетей
Генерация текста

akjindal53244/Arithmo-Mistral-7B

Добавлено:
akjindal53244/Arithmo-Mistral-7B

Модель Arithmo2-Mistral-7B улучшает первоначально выпущенную модель Arithmo-Mistral-7B по тестам GSM8K и MATH. В частности, наблюдается абсолютное улучшение: — +1,7% для GSM8K — +3,0% для GSM8K PoT — +1,9% для MATH P.S.: Если вы заинтересованы в поддержке вычислительных потребностей, обратитесь к Ашвини Джиндалу. Нам нужна небольшая поддержка, поэтому мы будем благодарны за любую помощь! 🙂 Арифмо-Мистраль-7Б обучен рассуждать и решать математические задачи, а также способен писать программу на Python, которая после выполнения выводит ответ на вопрос. Мы использовали Mistral-7B в качестве базовой модели и использовали QLoRA для его точной настройки на одном графическом процессоре RTX 4090. — Страница проекта на GitHub: https://github.com/akjindal53244/Arithmo-Mistral-7B — Разработано: Ашвини Кумар Джиндал, Анкур Парих — Финансируется: самостоятельная работа — Тип модели: тонкая настройка — Язык(и) (NLP): английский — Точная настройка на основе модели: mistralai/Mistral-7B-v0.1 Arithmo-Mistral-7B превосходит существующие современные модели математического мышления 7B и 13B. Более подробную информацию можно найти в разделе «Сравнение Арифмо-Мистраль-7Б с другими моделями LLM». Быстрый подход GSM8k MATH Нулевой CoT 74.7 25.3 Нулевой PoT 71.2 — — Нулевой CoT: Вкл…

Модальности:
Генерация текста


Задача: Генерация текста
Автор: akjindal53244
Теги: mistral, Mathematical Reasoning, en, text-generation-inference, endpoints_compatible
Лайков: 62  |  Загрузок: 776

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.