Data Catalog

Data Catalog — модуль для совместной работы с артефактами ML. Этот модуль включает набор сервисов для трансфера, хранения, анализа, управления доступом и жизненным циклом данных и артефактов машинного обучения: датасетов, моделей, Docker-образов.

В Data Catalog входит Data transfer service. Сервис обеспечивает обмен данными с заданной периодичностью и параметрами:

  • между S3-хранилищами Evolution, Advanced и системным хранилищем NFS ML Space;

  • из внешних источников — внешних S3-хранилищ наподобие Amazon S3, Google Cloud Storage и др., а также баз данных PostgreSQL, MS-SQL, My SQL, Oracle.

ML Space