product
iconМодель
Full Object Detection

Модель повышенного качества для распознавания классов объектов.

Лицензия
Apache 2.0
Бесплатно
Подключить
Категории
CVCV Aggregatorobject detection
Разработчик
Trieu
Описание

Возможности

Сервис позволяет распознавать объекты на изображениях. Подходит для задач с высокими требованиями к качеству предикта. Модель может быть полезна для сортировки изображений в фотобанках, классификации типов документов, решения задач поиска объектов определенного класса на изображениях большого разрешения с множеством деталей (например, грузовики на запрещенном для грузового транспорта участке дороги).

Пайплайн модели:

Единая нейронная сеть применяется к полному изображению. Сеть делит изображение на области, предсказывает ограничительные рамки и вероятности для каждой области. Ограничивающие рамки взвешиваются по прогнозируемым вероятностям.

Преимущества

Модели семейства YOLO исключительно быстры и намного превосходят R-CNN (Region-Based Convolutional Neural Network) и другие модели. Это позволяет добиться обнаружения объектов в режиме реального времени!

Изображение

Изображение

Сценарии использования

Детектирование объектов в реальном времени

Модель может быть дообучена под специфические задачи. Такие как:

  • медицинская диагностика по рентгеновским снимкам, гистологическим срезам и т.д.;
  • распознавание утечек на изображениях аэрофотосъемки;
  • визуальный контроль исправности деталей, качества производственного сырья и др;
  • определение нарушений, связанных с присутствием определенного класса объектов в запрещенных локациях, например: дети в опасных зонах, фаера на трибунах стадионов, люди на небезопасном расстоянии от строительной техники.

Инструкции по использованию

  1. Чтобы деплой был постоянно включен и ожидал запросов без задержки на инициализацию установить 1-1 pod. Если деплой больше не нужен, установить 0-1 pod, чтобы деплой перешел в режим ожидания и деньги не списывались.
  2. Чтобы создать деплой модели, необходимо указать следующий базовый образ: https://cr.msk.sbercloud.ru/aicloud-base-images/horovod-cuda10.0-tf1.15.0-pt1.3.0:0.0.28
  3. Изображение необходимо сконвертировать в BASE64 и отправить запрос.

Конвертер: https://codebeautify.org/image-to-base64-converter

Пример функции для конвертирования:

def open_images_base64(img_strs):
  return np.array(Image.open(BytesIO(base64.b64decode(img_strs))).convert("RGB"))[:,:,::-1]

def create_image(img):
  buffered = BytesIO()
  img.save(buffered, format="JPEG")
  img_str = base64.b64encode(buffered.getvalue()).decode("latin1")
  return img_str
  1. Для каждого изображения, которое необходимо распознать требуется отдельный запрос

Обучающие примеры

Запрос

{ "instances":[ { "image": "your base64 string" } ] }

Пример ответа

строка base64

Изображение

Изображение

Полезные сcылки

GitHub - https://github.com/thtrieu/darkflow

Дисклеймер

Начиная использовать контент, пользователь принимает условия Пользовательского соглашения и Лицензии контента. Ответственность за выбор и способы использования контента AI Marketplace (DataHub/AI Services) лежит на пользователе. В случае возникновения сомнений в соответствии описания контента с его фактическим содержимым и свойствами, Пользователь может обратиться в окно технической поддержки, размещенное на Платформе в модуле «Сообщить о проблеме».

Исчерпывающая информация по лицензии данного контента находится в разделе Лицензионное соглашение ниже.

Лицензионное соглашение

Лицензия на контент