Data Lake Insight (DLI) — это бессерверный сервис обработки и анализа данных, полностью совместимый с Apache Spark и Apache Flink экосистемы. Он освобождает вас от управления любыми серверами.
DLI поддерживает несколько методов запросов, включая стандартный SQL, Spark SQL и Flink SQL, с совместимостью с основными форматами данных. Вы можете использовать стандартный SQL или приложения Spark и Flink для запросов основных форматов данных без ETL. DLI поддерживает SQL‑запросы и приложения Spark для гетерогенных источников данных, включая CloudTable, RDS, DWS, CSS, OBS, пользовательские базы данных на ECS, и офлайн‑базы данных.
Для получения подробной информации о функциях DLI см Возможности.
Функция | Описание |
|---|---|
DLI — это сервис обработки данных и аналитики, построенный на безсерверной архитектуре. | DLI — это безсерверный сервис запросов и аналитики больших данных. С DLI вы платите только за фактически использованные вычислительные ресурсы, без необходимости поддерживать или управлять облачными серверами.
|
DLI поддерживает несколько вычислительных движков. | DLI полностью совместим с экосистемами, такими как Apache Spark и Apache Flink, и поддерживает стандартный SQL, Spark SQL и Flink SQL. Он совместим с популярными форматами данных, такими как CSV, JSON, Parquet и ORC.
|
DLI поддерживает несколько методов подключения. | DLI предоставляет несколько методов подключения, чтобы удовлетворить разнообразные потребности и сценарии пользователей. Методы подключения:
|
DLI может подключаться к нескольким источникам данных для межисточечной аналитики. |
|
Три базовых типа джоб поддерживаемых DLI |
|
DLI поддерживает раздельное хранение и вычисления. | После сохранения данных в OBS, вы можете подключить DLI к OBS для анализа данных. В архитектуре с раздельным хранением и вычислениями ресурсы хранения и вычислительные ресурсы можно запрашивать и оплачивать отдельно, что снижает затраты и повышает эффективность использования ресурсов. Вы можете выбрать storage single-AZ или multi-AZ при создании OBS Бакета для хранения избыточных данных в консоли DLI. Отличия двух политик хранения перечислены ниже:
|
DLI управляет и планирует ресурсы единым способом, используя эластичные пулы ресурсов. | Бэкенд эластичных пулов ресурсов использует архитектуру кластера CCE, поддерживая разнородные ресурсы, поэтому вы можете управлять и планировать ресурсы единым способом. Для получения подробной информации см Создание Elastic Resource Pool и создание очередей внутри него. |
DLI включает следующие основные модули:
Модуль | Описание |
|---|---|
Инструменты экосистемы | DLI использует свою надёжную безсерверную архитектуру и поддержку мульти‑модального движка для удовлетворения разнообразных потребностей различных отраслей, способствуя их цифровой трансформации и стимулируя инновации. |
Вычислительный движок |
|
Единое управление ресурсами |
|
Единое управление метаданными |
|
Сервис хранения | OBS и базы данных используются для хранения структурированных или неструктурированных данных для анализа данных, предоставляя постоянные сервисы хранения данных. |
Подключение источника данных |
|
Data applications | DLI can connect to mainstream BI tools in the industry to flexibly meet data presentation needs. |
A web-based service management platform is provided. You can access DLI using the management console or HTTPS-based APIs, or connect to the DLI server through the JDBC client.
You can submit SQL, Spark, or Flink jobs on the DLI management console.
If you need to integrate DLI into a third-party system for secondary development, you can call DLI APIs to use the service.
For details, see Data Lake Insight API Reference.
DataArts Studio is a one-stop data operations platform that provides intelligent data lifecycle management. It supports intelligent construction of industrial knowledge libraries and incorporates data foundations such as big data storage, computing, and analysis engines. With DataArts Studio, your company can easily construct end-to-end intelligent data systems. These systems can help eliminate data silos, unify data standards, accelerate data monetization, and promote digital transformation.
Create a data connection on the DataArts Studio management console to access DLI for data analysis.