Оплата за сервис Data Lake Insight осуществляется по модели «pay-as-you-go» — только за использованные ресурсы.
Актуальные цены указаны в разделе Тарифы.
Рассчитать предварительную стоимость и скачать документ Excel с расчетом можно в калькуляторе цен.
В сервисе Data Lake Insight тарифицируются:
вычислительные ресурсы — количество используемых вычислительных единиц;
хранение данных — объем данных, хранящихся в таблицах DLI и/или бакетах OBS;
сканированные данные — объем данных, обработанных в очереди «default».
Единица тарификации: шт. в час
Обозначение в тарифах: dli.elasticresourcepool
Вычислительные ресурсы DLI тарифицируются по количеству вычислительных единиц (compute unit, CU), используемых в пуле ресурсов. 1 CU состоит из 1 vCPU и 4 ГБ памяти. При создании пула ресурсов можно выбрать для него диапазон от 16 до 32 000 CU — столько единиц смогут использовать очереди заданий, закрепленные за этим пулом.
Узнать, сколько вычислительных единиц пула тарифицируется, можно на странице Resources → Resource Pool, в колонке Actual CUs.
Тарификация начинается с момента создания пула ресурсов и заканчивается с его удалением. Если пул не используется заданиями, плата за него продолжает начисляться.
Минимальное время использования пула — 1 час. Если удалить пул раньше, плата начислится за полный час.
Единица тарификации: ГБ в час
Обозначение в тарифах: uquery.internaltable
За хранение данных в таблицах DLI взимается плата. Тарификация начинается с момента создания таблицы и заканчивается с ее удалением.
Данные в DLI хранятся в сжатом виде — примерно 1/5 от оригинального объема. Плата начисляется за объем данных после сжатия.
Узнать, сколько данных хранится в таблицах DLI, можно на странице Data Management → Databases and Tables.
Если данные хранятся в бакетах OBS, плата начисляется за пользование сервисом OBS. Подробнее о тарификации Object Storage Service.
Единица тарификации: ГБ в час
Обозначение в тарифах: uquery.scan
Если вы запускаете задания в преднастроенной очереди «default», плата начисляется за объем сканированных данных.
Узнать, сколько данных было сканировано в каждом задании, можно на странице Job Management → SQL Jobs.
Стоимость сервиса Data Lake Insight рассчитывается по формуле:
\(Price = (Price_{Compute} + Price_{Storage} + Price_{ScannedData}) \times Duration\)
\(Price\) | Общая стоимость сервиса. |
\(Price_{Compute}\) | Cтоимость вычислительных единиц. |
\(Price_{Storage}\) | Cтоимость хранения данных в таблицах DLI и бакетах OBS. |
\(Price_{ScannedData}\) | Cтоимость сканирования данных в очереди «default». |
\(Duration\) | Период использования сервиса. |
Предположим, за месяц пользования сервисом Data Lake Insight вы запускали задания общей продолжительностью 20 часов. Перед запуском заданий вы приобретали пул вычислительных ресурсов на 128 CUs и удаляли пул сразу после выполнения заданий. Также вы хранили 900 ГБ данных в таблицах DLI и запускали задания в очереди «default» общей продолжительностью 2 часа, которые обработали 4 ГБ данных.
При таких условиях стоимость использования сервиса за 30 дней составит:
Цены из примера могут отличаться от актуальных цен на услуги.
Вычислительные единицы:
3,85398 ₽/час за 1 CU \(\times\) 128 CUs \(\times\) 20 часов использования = 9 866,1888 ₽
Хранение данных:
0,00305 ₽/час за 1 ГБ \(\times\) 900 ГБ данных \(\times\) 24 часа \(\times\) 30 дней = 1 976,4 ₽
Сканированные данные:
0,2074 ₽/час за 1 ГБ \(\times\) 4 ГБ сканированных данных \(\times\) 2 часа выполнения = 1,6592 ₽
Итоговая стоимость:
9 866,1888 \(+\) 1 976,4 \(+\) 1,6592 = 11 844,248 ₽
Чтобы посмотреть информацию о балансе, доступных грантах и потреблении, в личном кабинете перейдите в раздел Контроль затрат.
Чтобы избежать дополнительных трат, рекомендуется удалять пулы вычислительных ресурсов (en) и базы данных в DLI (en), если они не используются.