Экспериментальная версия NuExtract 2.0 — это семейство моделей, специально подготовленных для задач извлечения структурированной информации. Он поддерживает как мультимодальный ввод, так и является многоязычным. Примечание. Это экспериментальная версия, которая будет заменена NuExtract 2.0. Мы предоставляем несколько версий разных размеров, все они основаны на семействе InternVL2.5. Чтобы использовать модель, предоставьте входной текст/изображение и шаблон JSON, описывающий информацию, которую вам необходимо извлечь. Шаблон должен представлять собой объект JSON, в котором указаны имена полей и их ожидаемый тип. Типы поддержки включают в себя: дословная строка — дает указание модели извлекать текст, который дословно присутствует во входных данных. строка — общее строковое поле, которое может включать в себя перефразирование/абстракцию. целое число – целое число. число — целое или десятичное число. date-time — дата в формате ISO. Массив любого из вышеперечисленных типов (например, [«строка»]) enum — выбор из множества возможных ответов (представленных в шаблоне в виде массива вариантов, например [«да», «нет», «может быть»]). мульти-метка — перечисление, которое может иметь несколько возможных ответов (представленное в шаблоне как массив с двойной оболочкой, например [[«A», «B», «C»]]). Если модель не идентифицирует соответствующую информацию для…
Модальности:
Генерация текста
Области применения:
Диалог / чат Мультиязычность
Задача: Генерация текста
Автор: numind
Теги: internvl_chat, nlp, conversational, custom_code, multilingual
Лайков: 8 | Загрузок: 44
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.