tocdepth

2

Быстрый старт

С помощью быстрого старта вы создадите инстанс Spark для обработки больших данных и запустите задачу из бакета Object Storage.

Перед началом работы

Зарегистрируйтесь в личном кабинете Cloud.ru.

Если вы уже зарегистрированы, войдите под своей учетной записью.

После входа выполните шаги, необходимые для работы Spark:

  1. Создайте публичный SNAT-шлюз для доступа инстанса в интернет и связи с внешними источниками.

  2. Создайте подсеть, в которой будут размещены инстанс Spark и связанные сервисы Cloud.ru, например базы данных.

  3. Создайте секрет в сервисе Secret Manager.

  4. Создайте бакет Object Storage, в котором будет храниться журнал событий и код задачи Spark.

  5. Добавьте в Object Storage файл с кодом задачи Spark.

Создайте инстанс

  1. Перейдите в раздел Evolution и выберите сервис Managed Spark.

  2. Нажмите Создать инстанс.

  3. В блоке Общие параметры укажите название инстанса, например spark.

  4. В блоке Конфигурация выберите:

    • Вычислительные ресурсы — Small (vSPU 2, RAM 4).

    • Количество воркеров — 2.

  5. В блоке Настройки:

    • Место хранения журнала событий — выберите Object Storage.

    • Бакет — выберите бакет из списка.

  6. В блоке Логирование в поле Группа логов выберите группу логов.

  7. Нажмите Продолжить.

  8. В блоке Сетевые настройки:

  9. В блоке Настройки доступа:

    • Подключить публичный хост — активируйте опцию, чтобы опубликовать инстанс в интернете. Интерфейсы Spark History Server и Spark UI станут доступны из интернета.

    • Логин — задайте логин для доступа к Spark.

    • Пароль — выберите секрет для доступа к Spark.

      Вы можете создать новый секрет, нажав Создать новый секрет.

  10. Нажмите Создать.

Создание инстанса займет около 15 минут.

Создайте задачу

  1. В списке инстансов Managed Spark откройте нужный инстанс.

  2. Перейдите на вкладку Задачи.

  3. Нажмите Создать задачу.

  4. В блоке Общие параметры введите название задачи.

  5. В блоке Образ выберите базовый образ spark-3.5.

  6. В блоке Скрипт приложения:

    • Тип запускаемой задачи — язык программирования, на котором написана задача Spark.

    • Путь к запускаемому файлу — путь к задаче в Object Storage.

  7. (Опционально) Активируйте опцию Добавить аргумент, чтобы указать дополнительные аргументы командной строки для запуска скрипта задачи.

  8. В блоке Вычислительные ресурсы задайте вычислительные ресурсы для Driver и Executors.

  9. (Опционально) В блоке Настройки активируйте опции:

    • Добавить параметры окружения (ENV), чтобы настроить окружение.

    • Добавить Spark конфигурацию (–conf), чтобы указать дополнительные параметры выполнения задачи.

    • Добавить зависимости, чтобы добавить необходимые пакеты и библиотеки.

  10. Нажмите Создать.

Задача Spark начнет выполняться и отобразится на странице инстанса во вкладке Задачи.

Что дальше

Вы можете посмотреть логи задачи.

Запустили Evolution free tier
для Dev & Test
Получить