С помощью этого руководства вы научитесь загружать данные в Managed ArenadataDB через JDBC-клиент DBeaver и визуализировать их в Managed BI.
Вы будете использовать следующие сервисы:
Managed ArenadataDB — сервис, который позволяет разворачивать кластеры ArenadataDB и управлять ими без необходимости настраивать и обслуживать инфраструктуру.
Managed BI — сервис для визуализации и анализа данных.
Шаги:
Перед началом работы
Создайте публичный SNAT-шлюз в той зоне доступности, в которой собираетесь создавать кластер.
Создайте группу безопасности для инстанса ArenadataDB.
В этой группе безопасности создайте разрешающие правила для:
входящего трафика в подсети инстанса ArenadataDB;
исходящего трафика в подсети инстанса ArenadataDB;
ArenadataDB порт 5432;
ArenadataDB Control порт 81;
Arenadata Cluster Manager порт 8080.
-
В этой лог-группе создайте два DNS-сервера:
8.8.8.8
8.8.4.4
Создайте кластер Data Platform, в котором будет размещен инстанс.
Установите JDBC-клиент DBeaver.
1. Создайте инстанс Managed BI
Перейдите в раздел Evolution и выберите сервис Managed BI.
Нажмите Создать инстанс.
В поле Кластер выберите созданный ранее кластер.
В поле Вычислительные ресурсы выберите «vCPU 2, RAM 4».
Нажмите Продолжить.
В блоке Сетевые настройки выберите:
Подсеть — выберите созданную подсеть с DNS-сервером.
Группа безопасности — выберите созданную группу безопасности.
Нажмите Создать.
Создание инстанса занимает около 15 минут.
2. Создайте инстанс Managed ArenadataDB
Перейдите в раздел Evolution и выберите сервис Managed ArenadataDB.
В блоке Общие параметры заполните поля:
Название — adb-lab.
Тип лицензии — Test.
Версия ArenadataDB — 6.25.1.49.
Объем хранения данных, ТБ — 3 ТБ.
Нажмите Продолжить.
В блоке Сетевые настройки выберите:
VPC —
.Зона доступности —
.sNAT-шлюз — созданный шлюз.
Подсеть — подсеть c созданными DNS-серверами.
Группа безопасности — созданную группу безопасности с разрешающими правилами.
Подключить публичный хост — активируйте опцию.
Нажмите Продолжить.
В блоке Логирование выберите:
Лог-группа — группу логов с созданными ранее DNS-серверами.
Сервисный аккаунт — сервисный аккаунт.
Нажмите Создать.
Инстанс Managed ArenadataDB отобразится на странице сервиса. Создание может занять от 40 минут в зависимости от выбранной конфигурации.
3. Получите логин и пароль
Когда статус инстанса Managed ArenadataDB изменится на «Готов»:
Откройте карточку инстанса Managed ArenadataDB.
На вкладке Доступы в блоке Доступ к ADB нажмите Получить логин и пароль.
Cохраните логин и пароль.
ВниманиеЛогин и пароль отображаются один раз.
В целях безопасности рекомендуем изменить пароль. Сделать это можно в интерфейсе ADCM.
Нажмите Принято.
Логин и пароль понадобятся для настройки дальнейших подключений.
4. Подключите инстанс Managed ArenadataDB к DBeaver
В списке инстансов Managed ArenadataDB откройте карточку созданного ранее инстанса. Перейдите на вкладку Доступы. Информация из нее понадобится для подключения к DBeaver.
Запустите DBeaver.
В панели сверху нажмите База данных → Новое соединение.
В списке соединений выберите PostgreSQL или Greenplum.
На вкладке Главное введите:
Хост — публичный хост из карточки инстанса Managed ArenadataDB;
База данных — adb;
Пользователь — сохраненный ранее логин;
Пароль — сохраненный ранее пароль.
Нажмите Готово. На левой панели в списке баз данных появится база adb.
Откройте Базы данных → adb → Схемы → public → Таблицы.
Нажмите на название таблицы в этой папке, чтобы убедиться, что данные из нее отображаются.
5. Подключите инстанс Managed BI к базе данных
Откройте сервис Managed BI в новой вкладке браузера.
Убедитесь, что статус созданного ранее инстанса Managed BI изменился на «Готов».
На карточке инстанса нажмите Перейти в интерфейс BI.
Откройте Настройки → Подключения.
Нажмите База данных и выберите PostgreSQL.
Введите данные:
Хост — внутренний IP из карточки инстанса Managed ArenadataDB;
Порт — номер порта из карточки инстанса Managed ArenadataDB;
Имя базы данных — adb;
Имя пользователя — сохраненный ранее логин;
Пароль — сохраненный ранее пароль;
Отображаемое имя — укажите имя для базы данных.
Нажмите Подключить.
6. Переходите к визуализации данных
На этом шаге вы подключите датасет и создадите график, используя инструменты сервиса Managed BI.
Перейдите в раздел Датасеты.
Cправа сверху нажмите Датасет.
Введите данные:
База данных — выберите подключенную базу данных;
Схема — выберите public;
Таблица — выберите таблицу из списка, например, ad_table.
Нажмите Создать датасет и диаграмму.
Выберите тип графика — Таблица.
Нажмите Создать новый график.
Перетащите в поле Измерения идентификаторы нужных столбцов, например Maker, Adv_year, Color, Bodytype, Runned_Miles, Engin_size.
Проверьте получившуюся таблицу в поле предпросмотра и нажмите Сохранить.
Укажите имя графика и нажмите Сохранить.
Перейдите в раздел SQL → SQL Lab.
Введите данные:
База данных — выберите подключенную базу данных;
Схема — выберите public;
Таблица — выберите несколько таблиц из списка, например, ad_table, price_table, sales_table.
Нажмите Выполнить.
Нажмите Сохранить, укажите имя запроса и сохраните его.
Нажмите Создать график.
Выберите тип графика, например, Столбчатая диаграмма.
Перетащите идентификатор столбца Fuel_type в поле Ось Х.
Нажмите на название идентификатора в поле Ось Х и выберите вкладку Через SQL.
Укажите в поле "Fuel_type" и нажмите Сохранить.
Перетащите идентификатор столбца Fuel_type в поле Меры и нажмите на него для редактирования параметров.
На вкладке Столбец в поле Агрегатная функция выберите COUNT.
На вкладке Через SQL проверьте правильность запроса: COUNT("Fuel_type"). При необходимости внесите исправления и нажмите Сохранить.
В поле X-axis sort by выберите COUNT("Fuel_type").
Нажмите Обновить график.
Чтобы сохранить график, нажмите Сохранить и задайте имя графика.
Результат
Вы научились подключаться к базам данных Managed ArenadataDB для загрузки данных с помощью JDBC-клиента DBeaver, подключать Managed ArenadataDB к Managed BI и пользоваться основными инструментами для визуализации данных.