Small Object Detection modelБесплатно
Оптимизированная модель распознавания классов объектов.
Other
Возможности
Сервис позволяет распознавать объекты на изображениях.
Подходит для быстрого тестирования гипотез, запуска на небольших конфигурациях инфраструктуры и для задач с не высокими требованиями к качеству предикта.
Так же существует модель с полным функционалом распознавания объектов (ссылка на большую модель в платформе).
Мини-версия модели и модель с расширенными возможностями могут быть полезны для сортировки изображений в фотобанках, классификации типов документов, решения задач поиска объектов определенного класса на изображениях большого разрешения с множеством деталей (например, фаеры на трибунах стадионов).
Пайплайн модели:
Единая нейронная сеть применяется к полному изображению. Сеть делит изображение на области и предсказывает ограничительные рамки и вероятности для каждой области. Ограничивающие рамки взвешиваются по прогнозируемым вероятностям.
Преимущества
Работает быстро и точно. На карте, измеренной при .5 IOU, YOLOv3 находится на одном уровне с фокусной потерей, но примерно в 4 раза быстрее.
Сценарии использования
Детектирование объектов в реальном времени
Все веса модели доступны для скачивания, поэтому она может быть дообучена под специфические задачи. Такие как:
- медицинская диагностика по рентгеновским снимкам, гистологическим срезам и т.д.; распознавание утечек на изображениях аэрофотосъемки;
- визуальный контроль исправности деталей, качества производственного сырья и др.
Инструкции по использованию
- Чтобы деплой был постоянно включен и ожидал запросов без задержки на инициализацию установить 1-1 pod. Если деплой больше не нужен, установить 0-1 pod, чтобы деплой перешел в режим ожидания и деньги не списывались.
- Чтобы создать деплой модели, необходимо указать следующий базовый образ: https://cr.msk.sbercloud.ru/aicloud-base-images/horovod-cuda10.0-tf1.15.0-pt1.3.0:0.0.28
- Изображение необходимо сконвертировать в BASE64 и отправить запрос.
Конвертер: https://codebeautify.org/image-to-base64-converter
Пример функции для конвертирования:
def open_images_base64(img_strs):
return np.array(Image.open(BytesIO(base64.b64decode(img_strs))).convert("RGB"))[:,:,::-1]
def create_image(img):
buffered = BytesIO()
img.save(buffered, format="JPEG")
img_str = base64.b64encode(buffered.getvalue()).decode("latin1")
return img_str
- Для каждого изображения, которое необходимо распознать требуется отдельный запрос
Обучающие примеры
Запрос
{ "instances":[ { "image": "your base64 string" } ] }
Пример ответа
строка base64
Полезные сcылки
GitHub - https://github.com/quanhua92/darknet
Дисклеймер
Начиная использовать контент, пользователь принимает условия Пользовательского соглашения и Лицензии контента. Ответственность за выбор и способы использования контента AI Marketplace (DataHub/AI Services) лежит на пользователе. В случае возникновения сомнений в соответствии описания контента с его фактическим содержимым и свойствами, Пользователь может обратиться в окно технической поддержки, размещенное на Платформе в модуле «Сообщить о проблеме».
Исчерпывающая информация по лицензии данного контента находится в разделе Лицензионное соглашение ниже.
Лицензионное соглашение
Обратная связь
Круглосуточная поддержка по телефону 8 800 444-24-99, почте support@cloud.ru и в Telegram