Миграция бакета S3 в облако Advanced
Компонент CDM сервиса DataArts Studio позволяет мигрировать бакеты S3. В облаке Advanced бакеты управляются с помощью Object Storage Service — безопасного и надежного объектного хранилища, полностью совместимого с S3.
Для миграции:
-
подготовьте исходный бакет к миграции;
-
создайте с помощью сервиса OBS бакет в облаке Advanced;
-
используйте CDM для переноса бакета S3.
Подготовка исходного бакета S3
-
Скачайте ключи доступа SecretId и SK (Secret Key) к исходному бакету S3.
ПримечаниеВ некоторых облачных сервисах ключи доступа SecretId и SK к исходному бакету S3 можно получить только для сервисных аккаунтов.
-
Скопируйте и сохраните адрес точки подключения (endpoint) к исходному бакету S3, например «storage.mycloud.net».
Создание бакета OBS
Создайте бакет OBS, в который будут мигрировать данные из бакета S3.
При создании бакета можно задать класс хранения, политику доступа и другие параметры в соответствии с исходным бакетом.
Подготовка кластера CDM
-
Войдите в консоль управления Advanced:
-
В списке сервисов выберите DataArts Studio.
-
Выберите инстанс DataArts Studio и нажмите Access.
ПримечаниеЕсли инстанс DataArts Studio отсутствует, то необходимо создать его (en).
-
Откройте инстансу DataArts Studio доступ в интернет. Для этого:
-
Создайте NAT-шлюз в той же подсети, где расположен кластер CDM.
-
Добавьте SNAT-правило и привяжите к NAT-шлюзу созданный ранее внешний IP-адрес.
-
Перейдите на вкладку Workspace Management.
-
Выберите Data Integration для соответствующей рабочей области.
-
Выберите Cloud Data Migration.
ПримечаниеЕсли инстанс CDM отсутствует, то необходимо создать его (en).
Создание коннекторов
Перед созданием задачи на миграцию создайте коннекторы, позволяющие кластеру CDM считывать данные из бакета S3 и записывать их в облако Advanced.
-
На странице Cluster Management выберите Job Management → Links → Create Link.
-
Выберите коннектор типа «Amazon S3» для исходного бакета S3 и нажмите Next.
-
На странице настройки коннектора для исходного бакета S3 задайте его параметры:
-
Name — введите название коннектора.
-
Endpoint — введите адрес точки подключения (endpoint) к источнику данных. Например «storage.mycloud.net».
-
SecretId — вставьте идентификатор секретного ключа.
-
SK — вставьте секретный ключ SK к бакету.
-
-
Нажмите Test для проверки коннектора или нажмите Save, и система автоматически проверит соединение и сохранит коннектор после успешной проверки.
ПримечаниеЕсли транспортная сеть имеет низкую пропускную способность или источник данных имеет слишком большой размер, проверка коннектора может занять от 30 до 60 секунд.
-
Нажмите Create Link, чтобы перейти к созданию коннектора для целевого бакета OBS.
-
Выберите коннектор типа «Object Storage Service (OBS)» для целевого бакета в облаке Advanced и нажмите Next.
-
На странице настройки коннектора задайте его параметры:
-
Name — введите название коннектора.
-
OBS Bucket Type — тип данных источника. Выберите Object Storage.
-
AK — вставьте ключ доступа AK к бакету OBS.
-
SK — вставьте секретный ключ доступа SK к бакету OBS.
См.такжеИнструкция по созданию ключей доступа для ресурсов Object Storage Service.
-
-
Нажмите Test для проверки коннектора или нажмите Save, и система автоматически проверит соединение и сохранит коннектор после успешной проверки.
См.такжеДополнительные сведения о параметрах данных разных типов:
Создание и запуск задания на миграцию
-
Выберите Job Management → Table/File Migration → Create Job на странице Cluster Management.
-
Укажите настройки задания на шаге Configure Basic Information:
-
Job Name — введите название задания.
Название содержит от 1 до 256 символов и состоит из латинских букв, подчеркиваний (_), точек, дефисов и цифр, например «oracle2obs_t».
-
Source Link Name — выберите источник, из которого мигрируете данные.
-
Destination Link Name — выберите конечную точку, в которую мигрируете данные.
-
-
Укажите в блоке Source Job Configuration:
-
Bucket Name — название бакета S3, из которого мигрируете данные.
-
Source Directory/File — путь к каталогу, из которого мигрируете данные. Например, укажите «/», если нужно мигрировать содержимое всего бакета.
-
File Format — формат данных, в котором необходимо выполнить миграцию данных из источника. Для переноса всех файлов выберите Binary.
-
-
Укажите в блоке Destination Job Configuration:
-
Bucket Name — название бакета, в который мигрируете данные, например «bucket_2».
-
Write Directory — путь к каталогу OBS, в который мигрируете данные, например корневой каталог бакета «/».
-
File Format — формат данных, в котором мигрируете данные. Для переноса всех файлов выберите Binary.
ПримечаниеПри переносе данных между источниками данных, связанными с файлами, такими как FTP, SFTP, NAS, HDFS и OBS, значение параметра File Format должно совпадать с значением исходного формата файла.
Если файлы переносятся между FTP, SFTP, NAS, HDFS и OBS, а для источника миграции установлено значение Binary, то файлы будут передаваться напрямую, без сопоставления полей.
-
Duplicate File Processing Method — метод обработки дубликатов файлов. Выберите Skip.
Файлы с одинаковым именем и одного размера идентифицируются как дубликаты. При наличии дубликатов во время записи данных доступны следующие методы:
-
Replace — заменить;
-
Skip — пропустить;
-
Abandon — прекратить.
-
-
-
Нажмите Show Advanced Attributes в блоке Source Job Configuration и Destination Job Configuration для настройки дополнительных атрибутов источника данных и конечной точки миграции.
-
Нажмите Next для завершения создания задачи миграции.
-
Задайте расписание для выполнения задания миграции данных на шаге Configure Task:
-
Retry if Failure — количество повторных попыток при сбое. Выберите Never или Retry 3 times if failed.
ПодсказкаРекомендуется настроить автоматическую повторную попытку только для заданий переноса файлов или баз данных с включенным параметром Import to Staging Table, чтобы избежать несогласованности данных, вызванной повторной записью данных.
-
Group — выберите группу, в которой находится задание (группа по умолчанию — DEFAULT).
На странице Job Management задания можно отображать, запускать или экспортировать по группам.
-
Schedule Execution — включите возможность выполнения задания по расписанию.
Если выбран вариант Да, то можно задать время начала, цикл и срок действия задания.
-
Show Advanced Attributes — нажмите для настройки дополнительных атрибутов расписания миграции данных.
-
-
Нажмите Save and Run, чтобы сохранить и сразу запустить задание. Нажмите Save, чтобы только сохранить задание.
Задание можно запустить в любой момент — для этого на вкладке Table/File Migration нажмите Run.
Просмотр результатов миграции
-
Статус запущенного задания можно просмотреть на вкладке Table/File Migration.
ПримечаниеСостояние задания может быть New, Pending, Booting, Running, Failed, Succeeded или Stopped.
Pending означает, что задание ожидает выполнения по расписанию, а Booting означает, что данные, подлежащие миграции, анализируются.
-
После успешного завершения задания на миграцию откройте целевой бакет в консоли управления Object Storage Service и убедитесь, что он содержит файлы из исходного бакета S3.
- Подготовка исходного бакета S3
- Создание бакета OBS
- Подготовка кластера CDM
- Создание коннекторов
- Создание и запуск задания на миграцию
- Просмотр результатов миграции