Pleias-RAG-1B — это модель малого мышления с 1,2 миллиарда параметров, предназначенная для общего поиска с расширенным поиском (RAG), поиска и обобщения источников. Наряду с Pleias-RAG-1B он принадлежит к первому поколению специализированных моделей рассуждения Pleias. Pleias-RAG-1B превосходит большинство SLM (4 миллиарда параметров и ниже) по стандартизированным тестам для общего поиска с расширенным поиском (HotPotQA, 2wiki) и конкурирует со стандартными моделями 7-8b, включая Qwen-2.5-7B и Llama-3.1-8B. На сегодняшний день это единственный SLM, который поддерживает стабильную работу RAG на ведущих европейских языках и обеспечивает систематическое справочное обоснование заявлений. Благодаря своему размеру, простоте развертывания в ограниченной инфраструктуре (включая мобильные телефоны) и встроенной поддержке фактической и точной информации, Pleias-RAG-1B открывает ряд новых вариантов использования генеративного искусственного интеллекта. Pleias-RAG-1B — это специализированная языковая модель, использующая ряд специальных токенов для обработки структурированного ввода (запрос и источники) и генерации структурированного вывода (последовательность рассуждений и ответ с источниками). Для упрощения реализации мы рекомендуем использовать соответствующую библиотеку API. Pleias-RAG-1B изначально генерировал обоснованные ответы на основе…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: PleIAs
Теги: llama, en, fr, it, de, es, text-generation-inference, endpoints_compatible
Лайков: 68 | Загрузок: 127
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.