product
iconМодель
Small Object Detection model

Оптимизированная модель распознавания классов объектов.

Лицензия
Other
Бесплатно
Подключить
Категории
CVCV Aggregatorobject detection
Разработчик
Quan Hua
Описание

Возможности

Сервис позволяет распознавать объекты на изображениях.

Подходит для быстрого тестирования гипотез, запуска на небольших конфигурациях инфраструктуры и для задач с не высокими требованиями к качеству предикта.

Так же существует модель с полным функционалом распознавания объектов (ссылка на большую модель в платформе).

Мини-версия модели и модель с расширенными возможностями могут быть полезны для сортировки изображений в фотобанках, классификации типов документов, решения задач поиска объектов определенного класса на изображениях большого разрешения с множеством деталей (например, фаеры на трибунах стадионов).

Пайплайн модели:

Единая нейронная сеть применяется к полному изображению. Сеть делит изображение на области и предсказывает ограничительные рамки и вероятности для каждой области. Ограничивающие рамки взвешиваются по прогнозируемым вероятностям.

Преимущества

Работает быстро и точно. На карте, измеренной при .5 IOU, YOLOv3 находится на одном уровне с фокусной потерей, но примерно в 4 раза быстрее.

Изображение

Изображение

Сценарии использования

Детектирование объектов в реальном времени

Все веса модели доступны для скачивания, поэтому она может быть дообучена под специфические задачи. Такие как:

  • медицинская диагностика по рентгеновским снимкам, гистологическим срезам и т.д.; распознавание утечек на изображениях аэрофотосъемки;
  • визуальный контроль исправности деталей, качества производственного сырья и др.

Инструкции по использованию

  1. Чтобы деплой был постоянно включен и ожидал запросов без задержки на инициализацию установить 1-1 pod. Если деплой больше не нужен, установить 0-1 pod, чтобы деплой перешел в режим ожидания и деньги не списывались.
  2. Чтобы создать деплой модели, необходимо указать следующий базовый образ: https://cr.msk.sbercloud.ru/aicloud-base-images/horovod-cuda10.0-tf1.15.0-pt1.3.0:0.0.28
  3. Изображение необходимо сконвертировать в BASE64 и отправить запрос.

Конвертер: https://codebeautify.org/image-to-base64-converter

Пример функции для конвертирования:

def open_images_base64(img_strs):
  return np.array(Image.open(BytesIO(base64.b64decode(img_strs))).convert("RGB"))[:,:,::-1]

def create_image(img):
  buffered = BytesIO()
  img.save(buffered, format="JPEG")
  img_str = base64.b64encode(buffered.getvalue()).decode("latin1")
  return img_str
  1. Для каждого изображения, которое необходимо распознать требуется отдельный запрос

Обучающие примеры

Запрос

{ "instances":[ { "image": "your base64 string" } ] }

Пример ответа

строка base64

Изображение

Полезные сcылки

GitHub - https://github.com/quanhua92/darknet

Дисклеймер

Начиная использовать контент, пользователь принимает условия Пользовательского соглашения и Лицензии контента. Ответственность за выбор и способы использования контента AI Marketplace (DataHub/AI Services) лежит на пользователе. В случае возникновения сомнений в соответствии описания контента с его фактическим содержимым и свойствами, Пользователь может обратиться в окно технической поддержки, размещенное на Платформе в модуле «Сообщить о проблеме».

Исчерпывающая информация по лицензии данного контента находится в разделе Лицензионное соглашение ниже.

Лицензионное соглашение

Лицензия на контент