- Вопросы и ответы
- Задания в MRS
- Какие виды заданий (jobs) поддерживает MapReduce Service?
- Как разместить разработанные программы в MRS?
- Какие виды заданий (jobs) Spark поддерживаются кластерами MRS?
- Можно ли изменить узлы (nodes) кластера в консоли MRS Management?
- Что делать, если после отправки задания (job) Flume в Spark Streaming появилось сообщение об ошибке «The class cannot be found»?
- Что делать, если задание (job) оказалось запущено на Hue?
- Почему после запуска Yarn в списке отображается большое количество заданий (jobs)?
- Тарификация
- Термины и сокращения
- Товарные знаки
- Обратиться в поддержку
Какие виды заданий (jobs) поддерживает MapReduce Service?
Задания, предоставляемые сервисом MRS, являются платформой для выполнения программ. В настоящее время MRS поддерживает такие задания, как MapReduce, ClickHouse, Spark и Hive.
Тип задания |
Описание |
---|---|
MapReduce |
Модель программирования, предназначенная для параллельной обработки больших объемов данных (более одного ТБ) с разделением работы на множество независимых задач. Map делит одну задачу на несколько задач, а Reduce суммирует результаты обработки этих задач и выдает конечный результат анализа. После завершения разработки кода упакуйте его в JAR-файл в IDEA или Eclipse, загрузите файл в кластер MRS для выполнения |
Spark |
Механизм пакетной обработки данных с высокой скоростью обработки. Вычисления на основе Spark требуют большого количества памяти. Spark-задание включает в себя: - Spark: заканчивается .jar, независимый от регистра.
|
Hive |
Система управления базами данных на основe платформы Hadoop. Hive предоставляет язык запросов Hive (HiveQL), аналогичный языку структурированных запросов (SQL) для обработки структурированных данных. Hive автоматически преобразует HiveQL в скрипте Hive в задачу MapReduce для запроса и анализа данных, хранящихся в кластере Hive. Например, стандартный оператор HiveQL выглядит следующим образом:
|
ClickHouse |
Столбцовая СУБД для обработки аналитических запросов в реальном времени. |