product
iconДатасет
EasyPortrait

EasyPortrait — датасет и набор моделей для задач Portrait Segmentation и Face Parsing, содержит 20 тысяч изображений, размеченных на 9 классов, а также набор моделей для задачи сегментации изображений.

Иллюстрация сгенерирована в Kandinsky 2.1.

Лицензия
Other
Бесплатно
Подключить
Категории
datasetopen sourcedeep learningcomputer visionimage detectionimage recognitionimage classification
Разработчик
SberDevices
Описание

Изображение

EasyPortrait состоит из 20 000 цветных изображений, на каждом из которых представлен один из 8 377 уникальных пользователей. Датасет разбит на обучающую (train), валидационную (valid) и тестовую (test) выборки с 16000, 2000 и 4000 сэмплами соответственно. Все данные и обученные на них модели для задач классификации и детекции жестов абсолютно бесплатны и доступны для скачивания.

Разметка: segmentation masks Фреймворк: pytorch Размер файлов: 26GB Количество классов: 9 Число изображений: 20000 Формат изображений: FullHD, RGB Уникальных пользователей: 8377

Разработчик: SberDevices

Возможности

Большая часть фотографий собрана в домашних условиях или в закрытых помещениях. На каждой из них человек делал фото самого себя или на веб-камеру, или на фронтальную камеру мобильного телефона. Изображения собирались в различных условиях освещения, а расстояние субъектов до камеры варьируется в среднем от 0,5 до 2 метров. Датасет сбалансирован по полу субъектов, возраст которых от 14 до 65 лет.

Каждому изображению соответствует качественная сегментационная маска, разделенная на 9 классов: background, person, skin, left brow, right brow, left eye, right eye, lips, teeth. Сегментационные маски представляют собой двумерные массивы в виде PNG-картинок, каждый класс в массиве представлен своим значением от 0 до 8.

Классы разметки:

IndexClass
0BACKGROUND
1PERSON
2SKIN
3LEFT BROW
4RIGHT_BROW
5LEFT_EYE
6RIGHT_EYE
7LIPS
8TEETH

Для более подробного анализа изображений в нашем репозитории предоставлена дополнительная информация о данных — ширина и высота изображений, средняя яркость фотографий, анонимизированные ID субъектов, с помощью которых датасет может быть разделен на выборки самостоятельно.

В разметке EasyPortrait есть несколько важных нюансов, отличающих его от большинства наборов данных для задачи фейс парсинга:

  • Борода, грубая щетина и усы не считаются частью маски кожи. Это даст возможность улучшить визуальное качество сглаживания кожи и использовать датасет для задач бьютификации;
  • Внутренняя часть рта отделена от зубов, что позволяет решать задачу отбеливания зубов без использования эвристик.

Сценарии использования

Портретная сегментация, фейс парсинг (бьютификация лица, отбеливание зубов, изменение цвета глаз или бровей, разглаживание кожи).

Инструкции по использованию

Вы можете скачать датасет размером 26GB. Также мы разбили датасет на три выборки - обучающую, валидационную и тестовую, которые можно скачать по-отдельности. Разметка представлена отдельным файлом.

Обучающие примеры

На этом датасете мы обучили большой набор моделей, которые также можно скачать по ссылкам:

Model NameParameters (M)Input shapemIOU
LR-ASPP + MobileNet-V31.141024 × 102477.55
FCN + MobileNet-V29.71384 × 38474.3
FCN + MobileNet-V29.71512 × 51277.01
FCN + MobileNet-V29.711024 × 102481.23
FPN + ResNet-5028.5512 × 51283.13
FPN + ResNet-5028.51024 × 102485.97
BiSeNet-V214.79512 × 51277.93
BiSeNet-V214.791024 × 102483.53
SegFormer-B03.72384 × 38479.82
SegFormer-B03.721024 × 102484.27
SegFormer-B224.73384 × 38481.59
SegFormer-B224.73512 × 51283.03
SegFormer-B224.731024 × 102485.72
SegFormer-B581.97384 × 38481.66
SegFormer-B581.971024 × 102485.80
SegNeXt + MSCAN-T4.23384 × 38475.01
SegNeXt + MSCAN-T4.23512 × 51278.59

Авторы

  • Капитанов Александр
  • Кванчиани Карина
  • Кириллова София

Ccылки