MBZUAI/MobiLlama-08B

MobiLlama-08B — это модель малого языка с 0,8 миллиарда параметров. Он был обучен с использованием источников данных Amber Amber-Dataset. «Чем больше, тем лучше» стало преобладающей тенденцией в недавней разработке моделей большого языка (LLM). Однако LLM не очень хорошо подходят для сценариев, требующих обработки на устройстве, энергоэффективности, небольшого объема памяти и эффективности реагирования. Эти реквизиты имеют решающее значение для конфиденциальности, безопасности и устойчивого развертывания. В этой статье исследуется парадигма «меньше значит больше», решая задачу разработки точных, но эффективных моделей малого языка (SLM) для устройств с ограниченными ресурсами. Наш основной вклад — это внедрение точного и полностью прозрачного SLM с открытым исходным кодом с 0,5 миллиарда (0,5 млрд) параметров под названием MobiLlama, удовлетворяющего конкретные потребности вычислений с ограниченными ресурсами, с упором на повышение производительности при снижении требований к ресурсам. MobiLlama — это проект SLM, который начинается с более крупной модели и применяет тщательную схему совместного использования параметров, чтобы сократить как затраты на предварительное обучение, так и затраты на развертывание. Наша работа направлена не только на устранение разрыва в SLM с открытым исходным кодом, но и на обеспечение полной прозрачности там, где она полная…

Модальности:
Генерация текста

Области применения:
Генерация кода

Задача: Генерация текста
Автор: MBZUAI
Теги: llama, nlp, code, custom_code, en, text-generation-inference, endpoints_compatible
Лайков: 6 | Загрузок: 8

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

grimjim/Llama-3.1-8B-Instruct-abliterated_via_adapter-GGUF

udkai/Turdus

RedHatAI/DeepSeek-R1-Distill-Llama-70B-FP8-dynamic

DavidAU/Reka-Flash-3-21B-Reasoning-Uncensored-MAX-NEO-Imatrix-GGUF