- tocdepth
2
Как подготовить исходные данных для MRS?
MapReduce Service может обрабатывать данные как из OBS, так и из HDFS. Перед использованием MRS для анализа данных их нужно подготовить следующим образом:
Загрузите данные в бакет OBS:
Авторизуйтесь в консоль управления.
В списке сервисов выберите Object Storage Service.
Создайте бакет «userdata», после чего создайте в нем папки «program», «input» и «output»:
Для создания бакета: нажмите Create Bucket, в поле Bucket Name укажите «userdata» и нажмите Create Now.
Для создания папок: нажмите на название бакета, перейдите в раздел Objects и нажмите Create Folder. Последовательно создайте папки «program», «input» и «output».
Загрузите данные в бакет «userdata»:
Нажмите на папку «program», нажмите Upload Object, перетащите программу в окно или нажмите Add file. Нажмите ОК.
Повторите процесс с папками «input» и «output».
Загрузите данные с OBS в HDFS.
Эта функция доступна только, если отключена проверка аутентификации Kerberos, а кластер находится в рабочем состоянии:
В списке сервисов выберите MapReduce Service.
Нажмите на название кластера, перейдите на вкладку Files и выберите HDFS File List.
Нажмите на папку хранилища данных, например, bd_app1 или создайте новую — нажмите Create Folder.
Нажмите Import Data. Нажмите Browse для загрузки файла из бакета OBS или указания пути HDFS.
Загруженный файл можно увидеть на вкладке
.для Dev & Test