Технический лидер (Инфраструктурный мониторинг)

ИнженерыБолее 6 летУдаленно

Оставить резюме//

Обязанности

Команда мониторинга ищет талантливых специалистов, готовых присоединиться к нам в нашей миссии улучшения мониторинга и повышения надежности инфраструктуры и сервисов.

Мы – команда увлеченных профессионалов, которые отвечают за мониторинг всей инфраструктуры облака: от серверов и сетевых устройств до фронтенда.
Наша команда использует передовые технологии и инструменты для автоматизации процессов мониторинга, что позволяет нам быстро реагировать на любые проблемы и предотвращать возможные сбои. Мы также тесно сотрудничаем с другими командами внутри компании, чтобы обеспечить максимальную эффективность работы всей инфраструктуры.

Присоединяйтесь к нам и помогите сделать облачные сервисы еще лучше!

Обязанности:

Помощь продуктовым командам в развитии мониторинга, внедрение методики обеспечения надежности и применение прочих SRE-практик;
Создание платформы и инструментов для Observability;
Участие в построении общекорпоративной экосистемы мониторинга, алертинга, хранения метрик и визуализации (разработка и предоставление инструментов "как сервис");
Обеспечение бесперебойной работы сервисов и поддержка инфраструктуры команды;
Управление конфигурацией, автоматизация развертывания и обновления сервисов, и прочих рутинных операций (configuration management, Infrastructure as Code).

Требования

Опыт построения long-term хранилища метрик на базе VictoriaMetrics;
Опыт внедрения трассировки (tracing) на базе OpenTelemetry;
Умение работать с Git, Ansible/Salt, JSON, YAML и опыт написания CI/CD пайплайнов;
Опыт работы с Terraform;
Понимание принципов работы систем мониторинга и алертинга, метрик и time series, построения графиков и т.д.;
Понимание методологии DevOps и опыт взаимодействия с Agile командами разработки;
Понимание Linux (Ubuntu) и работы с сетевым стеком (HTTP, TCP/IP, DNS, REST API);
Владение любым языком: Bash, Python, Go, Groovy и т.д.;
Опыт работы с системами виртуализации и контейнеризации.

Будет плюсом:
Понимание паттернов обеспечения отказоустойчивости - load balancing, circuit breakers, disaster recovery;
Понимание критериев доступности - SLO, SLI, SLA или общее представление о практиках SRE;
Опыт работы с Kubernetes, организации его мониторинга и владение Helm.

Условия

Участие в создании инновационных продуктов;
Оформление по ТК РФ и “белая” зарплата;
Конкурентный уровень дохода (оклад, который мы обсудим по итогам собеседования + годовой бонус);
Офис в центре Москвы, коворкинг в Питере или возможность работать полностью удаленно на территории РФ;
Гибкое начало рабочего дня и сокращенный рабочий день в пятницу;
Льготная программа ипотечного и потребительского кредитования;
ДМС со стоматологией и возможностью льготного подключения к программе своих детей и родственников;
Прозрачная система мотивации, которая позволяет влиять на уровень дохода;
Работа в команде профессионалов;
Возможность вертикального и горизонтального роста.

Ещё у нас:

Бонусные программы от компаний партнёров;
Реферальная программа, бонусы за рекомендации кандидатов на открытые вакансии;
Материальная помощь при рождении детей и других семейных обстоятельствах;
Обучение в корпоративном университете;
Возможность участвовать в профильных конференциях в качестве спикера или слушателя;
Корпоративная жизнь: спортивные комьюнити, клубы по интересам (например, настолки, интеллектуальные игры, велоклуб и многие другие).