Поиск
EasyPortrait-image

EasyPortrait

EasyPortrait — датасет и набор моделей для задач Portrait Segmentation и Face Parsing, содержит 40 тысяч изображений, размеченных на 9 классов, а также набор моделей для задачи сегментации изображений.

Изображение

EasyPortrait состоит из 40 000 цветных изображений, на каждом из которых представлен один из 13 705 уникальных пользователей. Датасет разбит на обучающую (train), валидационную (valid) и тестовую (test) выборки с 30 000, 4 000 и 6 000 сэмплами соответственно. Все данные и обученные на них модели для задач Portrait Segmentation и Face Parsing абсолютно бесплатны и доступны для скачивания.

Разметка: segmentation masks Фреймворк: pytorch Размер файлов: 91.78GB Количество классов: 9 Число изображений: 40 000 Формат изображений: FullHD, RGB Уникальных пользователей: 13 705

Возможности

Большая часть фотографий собрана в домашних условиях или в закрытых помещениях. На каждой из них человек делал фото самого себя или на веб-камеру, или на фронтальную камеру мобильного телефона. Изображения собирались в различных условиях освещения, а расстояние субъектов до камеры варьируется в среднем от 0,5 до 2 метров. Датасет сбалансирован по полу субъектов, возраст которых от 14 до 65 лет.

Каждому изображению соответствует качественная сегментационная маска, разделенная на 9 классов: background, person, skin, left brow, right brow, left eye, right eye, lips, teeth. Сегментационные маски представляют собой двумерные массивы в виде PNG-картинок, каждый класс в массиве представлен своим значением от 0 до 8.

Классы разметки:

IndexClass
0BACKGROUND
1PERSON
2SKIN
3LEFT BROW
4RIGHT_BROW
5LEFT_EYE
6RIGHT_EYE
7LIPS
8TEETH

Для более подробного анализа изображений в нашем репозитории предоставлена дополнительная информация о данных — ширина и высота изображений, средняя яркость фотографий, анонимизированные ID субъектов, с помощью которых датасет может быть разделен на выборки самостоятельно.

В разметке EasyPortrait есть несколько важных нюансов, отличающих его от большинства наборов данных для задачи фейс парсинга:

  • Борода, грубая щетина и усы не считаются частью маски кожи. Это даст возможность улучшить визуальное качество сглаживания кожи и использовать датасет для задач бьютификации;
  • Внутренняя часть рта отделена от зубов, что позволяет решать задачу отбеливания зубов без использования эвристик.

Сценарии использования

Портретная сегментация, фейс парсинг (бьютификация лица, отбеливание зубов, изменение цвета глаз или бровей, разглаживание кожи).

Инструкции по использованию

Вы можете скачать датасет размером 91.78GB. Также мы разбили датасет на три выборки — обучающую, валидационную и тестовую, которые можно скачать по-отдельности. Разметка представлена отдельным файлом.

FileLinkSize
imageshttps://sc.link/8P3s491.8 GB
annotationshttps://sc.link/veWCw657.1 MB
metahttps://sc.link/ARq1X1.9 MB
train sethttps://sc.link/Trbsn68.3 GB
validation sethttps://sc.link/sKJwr10.7 GB
test sethttps://sc.link/mdEUq12.8 GB

Обучающие примеры

На этом датасете мы обучили большой набор моделей, которые также можно скачать по ссылкам:

Portrait segmentation:

Model NameLinkParameters (M)Input shapemIoU
BiSeNet-V2https://sc.link/hezsT56.5384 x 38497.95
DANethttps://sc.link/MDxwR190.2384 x 38498.63
DeepLabv3https://sc.link/hEXRA260384 x 38498.63
ExtremeC3Nethttps://sc.link/pOMP10.15384 x 38496.54
Fast SCNNhttps://sc.link/p83Fh6.13384 x 38497.64
FCN + MobileNetv2https://sc.link/n4oRO31.17384 x 38498.19
FPN + ResNet50https://sc.link/PF7QW108.911024 × 102498.54
FPN + ResNet50https://sc.link/kOWQd108.91512 × 51298.64
FPN + ResNet50https://sc.link/P97Xx108.91384 x 38498.64
FPN + ResNet50https://sc.link/mflpV108.91224 × 22498.31
SegFormer-B0https://sc.link/cFh9J14.91024 × 102498.74
SegFormer-B0https://sc.link/558Rn14.9512 × 51298.66
SegFormer-B0https://sc.link/lFrRm14.9384 x 38498.61
SegFormer-B0https://sc.link/F4U2y14.9224 × 22498.17
SINethttps://sc.link/JCoYp0.13384 x 38493.32

Face parsing:

Model NameLinkParameters (M)Input shapemIoU
BiSeNet-V2https://sc.link/5UzVf56.5384 x 38476.72
DANethttps://sc.link/PY4HA190.2384 x 38479.3
DeepLabv3https://sc.link/b3r0o260384 x 38479.11
EHANethttps://sc.link/vuZZq44.81384 x 38472.56
Fast SCNNhttps://sc.link/D2MEF6.13384 x 38467.56
FCN + MobileNetv2https://sc.link/JPZTv31.17384 x 38475.23
FPN + ResNet50https://sc.link/Fb1i2108.911024 × 102485.37
FPN + ResNet50https://sc.link/dZ0Cl108.91512 × 51283.33
FPN + ResNet50https://sc.link/NiqIN108.91384 x 38481.83
FPN + ResNet50https://sc.link/s9ZrX108.91224 × 22475.6
SegFormer-B0https://sc.link/m1zQ814.91024 × 102485.42
SegFormer-B0https://sc.link/bcjJq14.9512 × 51283.19
SegFormer-B0https://sc.link/pCZHm14.9384 x 38481.38
SegFormer-B0https://sc.link/AxPfm14.9224 × 22474.83

Авторы

  • Капитанов Александр
  • Кванчиани Карина
  • Петрова Елизавета
  • Ефремян Карен
  • Саутин Александр

Ccылки

Обратная связь

Круглосуточная поддержка по телефону 8 800 444-24-99, почте support@cloud.ru и в Telegram