Технический лидер (Инфраструктурный мониторинг)
Обязанности
Команда мониторинга ищет талантливых специалистов, готовых присоединиться к нам в нашей миссии улучшения мониторинга и повышения надежности инфраструктуры и сервисов.
Мы – команда увлеченных профессионалов, которые отвечают за мониторинг всей инфраструктуры облака: от серверов и сетевых устройств до фронтенда.
Наша команда использует передовые технологии и инструменты для автоматизации процессов мониторинга, что позволяет нам быстро реагировать на любые проблемы и предотвращать возможные сбои. Мы также тесно сотрудничаем с другими командами внутри компании, чтобы обеспечить максимальную эффективность работы всей инфраструктуры.
Присоединяйтесь к нам и помогите сделать облачные сервисы еще лучше!
Обязанности:
- Помощь продуктовым командам в развитии мониторинга, внедрение методики обеспечения надежности и применение прочих SRE-практик;
- Создание платформы и инструментов для Observability;
- Участие в построении общекорпоративной экосистемы мониторинга, алертинга, хранения метрик и визуализации (разработка и предоставление инструментов "как сервис");
- Обеспечение бесперебойной работы сервисов и поддержка инфраструктуры команды;
- Управление конфигурацией, автоматизация развертывания и обновления сервисов, и прочих рутинных операций (configuration management, Infrastructure as Code).
Требования
- Опыт построения long-term хранилища метрик на базе VictoriaMetrics;
- Опыт внедрения трассировки (tracing) на базе OpenTelemetry;
- Умение работать с Git, Ansible/Salt, JSON, YAML и опыт написания CI/CD пайплайнов;
- Опыт работы с Terraform;
- Понимание принципов работы систем мониторинга и алертинга, метрик и time series, построения графиков и т.д.;
- Понимание методологии DevOps и опыт взаимодействия с Agile командами разработки;
- Понимание Linux (Ubuntu) и работы с сетевым стеком (HTTP, TCP/IP, DNS, REST API);
- Владение любым языком: Bash, Python, Go, Groovy и т.д.;
- Опыт работы с системами виртуализации и контейнеризации.
Будет плюсом: - Понимание паттернов обеспечения отказоустойчивости - load balancing, circuit breakers, disaster recovery;
- Понимание критериев доступности - SLO, SLI, SLA или общее представление о практиках SRE;
- Опыт работы с Kubernetes, организации его мониторинга и владение Helm.
Условия
- Участие в создании инновационных продуктов;
- Оформление по ТК РФ и “белая” зарплата;
- Конкурентный уровень дохода (оклад, который мы обсудим по итогам собеседования + годовой бонус);
- Офис в центре Москвы, коворкинг в Питере или возможность работать полностью удаленно на территории РФ;
- Гибкое начало рабочего дня и сокращенный рабочий день в пятницу;
- Льготная программа ипотечного и потребительского кредитования;
- ДМС со стоматологией и возможностью льготного подключения к программе своих детей и родственников;
- Прозрачная система мотивации, которая позволяет влиять на уровень дохода;
- Работа в команде профессионалов;
- Возможность вертикального и горизонтального роста.
Ещё у нас:
- Бонусные программы от компаний партнёров;
- Реферальная программа, бонусы за рекомендации кандидатов на открытые вакансии;
- Материальная помощь при рождении детей и других семейных обстоятельствах;
- Обучение в корпоративном университете;
- Возможность участвовать в профильных конференциях в качестве спикера или слушателя;
- Корпоративная жизнь: спортивные комьюнити, клубы по интересам (например, настолки, интеллектуальные игры, велоклуб и многие другие).
откликнуться
Подходит вакансия? Оставь нам свое резюме и контактные данные

№1 на рынке искусственного интеллекта
CNews Analytics, 2023

№1 по темпам роста IaaS-сервисов
Data Center Awards 2023

№1 по PaaS-сервисам
iKS-Consulting, 2022

№1 в рейтинге лучших работодателей в сфере облачных услуг
Telecom Daily, 2023
