Облачная платформаAdvanced

Тарификация сервиса Data Lake Insight


Оплата за сервис Data Lake Insight осуществляется по модели «pay-as-you-go» — только за использованные ресурсы.

Актуальные цены указаны в разделе Тарифы.

Рассчитать предварительную стоимость и скачать документ Excel с расчетом можно в калькуляторе цен.

Правила тарификации

В сервисе Data Lake Insight тарифицируются:

  • вычислительные ресурсы — количество используемых вычислительных единиц;

  • хранение данных — объем данных, хранящихся в таблицах DLI и/или бакетах OBS;

  • сканированные данные — объем данных, обработанных в очереди «default».

Вычислительные ресурсы

Единица тарификации: шт. в час

Обозначение в тарифах: dli.elasticresourcepool

Вычислительные ресурсы DLI тарифицируются по количеству вычислительных единиц (compute unit, CU), используемых в пуле ресурсов. 1 CU состоит из 1 vCPU и 4 ГБ памяти. При создании пула ресурсов можно выбрать для него диапазон от 16 до 32 000 CU — столько единиц смогут использовать очереди заданий, закрепленные за этим пулом.

Подсказка

Узнать, сколько вычислительных единиц пула тарифицируется, можно на странице Resources → Resource Pool, в колонке Actual CUs.

Тарификация начинается с момента создания пула ресурсов и заканчивается с его удалением. Если пул не используется заданиями, плата за него продолжает начисляться.

Минимальное время использования пула — 1 час. Если удалить пул раньше, плата начислится за полный час.

Хранение данных

Единица тарификации: ГБ в час

Обозначение в тарифах: uquery.internaltable

За хранение данных в таблицах DLI взимается плата. Тарификация начинается с момента создания таблицы и заканчивается с ее удалением.

Данные в DLI хранятся в сжатом виде — примерно 1/5 от оригинального объема. Плата начисляется за объем данных после сжатия.

Подсказка

Узнать, сколько данных хранится в таблицах DLI, можно на странице Data Management → Databases and Tables.

Если данные хранятся в бакетах OBS, плата начисляется за пользование сервисом OBS. Подробнее о тарификации Object Storage Service.

Сканированные данные

Единица тарификации: ГБ в час

Обозначение в тарифах: uquery.scan

Если вы запускаете задания в преднастроенной очереди «default», плата начисляется за объем сканированных данных.

Подсказка

Узнать, сколько данных было сканировано в каждом задании, можно на странице Job Management → SQL Jobs.

Правила расчета стоимости

Стоимость сервиса Data Lake Insight рассчитывается по формуле:

\(Price = (Price_{Compute} + Price_{Storage} + Price_{ScannedData}) \times Duration\)

\(Price\)

Общая стоимость сервиса.

\(Price_{Compute}\)

Cтоимость вычислительных единиц.

\(Price_{Storage}\)

Cтоимость хранения данных в таблицах DLI и бакетах OBS.

\(Price_{ScannedData}\)

Cтоимость сканирования данных в очереди «default».

\(Duration\)

Период использования сервиса.

Пример расчета

Предположим, за месяц пользования сервисом Data Lake Insight вы запускали задания общей продолжительностью 20 часов. Перед запуском заданий вы приобретали пул вычислительных ресурсов на 128 CUs и удаляли пул сразу после выполнения заданий. Также вы хранили 900 ГБ данных в таблицах DLI и запускали задания в очереди «default» общей продолжительностью 2 часа, которые обработали 4 ГБ данных.

При таких условиях стоимость использования сервиса за 30 дней составит:

Примечание

Цены из примера могут отличаться от актуальных цен на услуги.

  1. Вычислительные единицы:

    3,85398 ₽/час за 1 CU \(\times\) 128 CUs \(\times\) 20 часов использования = 9 866,1888 ₽

  2. Хранение данных:

    0,00305 ₽/час за 1 ГБ \(\times\) 900 ГБ данных \(\times\) 24 часа \(\times\) 30 дней = 1 976,4 ₽

  3. Сканированные данные:

    0,2074 ₽/час за 1 ГБ \(\times\) 4 ГБ сканированных данных \(\times\) 2 часа выполнения = 1,6592 ₽

  4. Итоговая стоимость:

    9 866,1888 \(+\) 1 976,4 \(+\) 1,6592 = 11 844,248 ₽

Просмотр детализации потребления

Чтобы посмотреть информацию о балансе, доступных грантах и потреблении, в личном кабинете перейдите в раздел Контроль затрат.

Подсказка

Чтобы избежать дополнительных трат, рекомендуется удалять пулы вычислительных ресурсов (en) и базы данных в DLI (en), если они не используются.