Топ-100
Entity Recognition-image

Entity Recognition

Извлечение объектов (сущностей) из текстов и документов

Лицензия

Other

Сервис построен на базе mBERT и обучена на наборе данных WikiNEuRal для многоязычного NER. Система поддерживает 9 языков (ru, de, en, es, fr, it, nl, pl, pt)

Возможности

Сервис позволяет выделять именованные сущности из текста. Список именованных сущностей:

  1. Person (Личность)
  2. Organization (Организация)
  3. Location (Местоположение)
  4. Miscellaneous (Остальное)
  5. В Miscellaneous попадают в основном наименование ПО, сервисов, популярных объектов общего характера.

Примеры бизнес-сценариев

  1. Определение типа документа для его последующей маршрутизации в системы хранения и обработки
  2. Определение условий в документе (даты, сроки, суммы, ответственность, риски, реквизиты контрагентов и т.п.)
  3. Текстовый поиск документов по соответствующим сущностям
  4. Сопоставление и выявление расхождений в текстах, оценка рисков
  5. Проверка комплектности документов по заданным словам
  6. Заполнение карточек документов

Специфика

Любые пожелания и требования по доработке сервиса под вашу конкретную бизнес-задачу (на базе ваших данных) приветствуются.

Пример взаимодействия

После того как вы запустили модель, получили адрес и создали API токен для запросов, можно начать делать запросы на выделение именованных сущностей.

Форма запроса:

{ "instances": ["Текст для классификации"] }

Форма ответа:

{
  "predictions": [
{ "entity_group": "<TAG>", "score": 0.9990847706794739, "word": "ИМЕНОВАННАЯ СУЩНОСТЬ", "start": 17, "end": 35 },
  ]
}

Пример запроса на Python:

import requests

BASE_URL = "https://mlspace.aicloud.sbercloud.ru/deployments/<region>/<deploy_name>/v1/models/<deploy_name>:predict"

res = requests.post(BASE_URL,
    json=
{ "instances":[ "Жителям северных территорий Хабаровского края предоставят субсидии на развитие оленеводства, сообщили в пресс-службе правительства региона"] },
    headers=
{ "x-workspace-id": "<your_workspace_id>", "content-type":"application/json", "x-api-key":"<your_api_key>" }
)

Подключение

Для работы с сервисом необходимо нажать кнопку Создать деплой и выбрать параметры инфраструктуры (Подробнее о параметрах, о тарификации). К деплою можно отправлять запросы на хост + для целевого использования модели. REST API сервиса использует протокол HTTP для отправки данных и ответы в формате JSON. HTTP-запросы можно исполнить из консоли с помощью инструмента командной строки curl {+}.

Инструкция отправка HTTP-запросов к сервису доступна по ссылке.

Обратная связь

Круглосуточная поддержка по телефону 8 800 444-24-99, почте support@cloud.ru и в Telegram