yandex

Инженер VictoriaMetrics

ИнженерыБолее 6 летУдаленно
Оставить резюме//

Обязанности

Мы – команда увлеченных профессионалов, которые отвечают за мониторинг всей инфраструктуры облака: от серверов и сетевых устройств до фронтенда.
Наша команда использует передовые технологии и инструменты для автоматизации процессов мониторинга, что позволяет нам быстро реагировать на любые проблемы и предотвращать возможные сбои. Мы также тесно сотрудничаем с другими командами внутри компании, чтобы обеспечить максимальную эффективность работы всей инфраструктуры.

Присоединяйтесь к нам и помогите сделать облачные сервисы еще лучше!
 

  • Помощь продуктовым командам в развитии мониторинга, внедрение методики обеспечения надежности и применение прочих SRE-практик;
  • Создание платформы и инструментов для Observability;
  • Участие в построении общекорпоративной экосистемы мониторинга, алертинга, хранения метрик и визуализации (разработка и предоставление инструментов "как сервис");
  • Обеспечение бесперебойной работы сервисов и поддержка инфраструктуры команды;
  • Управление конфигурацией, автоматизация развертывания и обновления сервисов, и прочих рутинных операций (configuration management, Infrastructure as Code).

Требования

  • Опыт построения long-term хранилища метрик на базе VictoriaMetrics;
  • Опыт внедрения мониторинга и трассировки на базе OpenTelemetry;
  • Практический опыт IaC (Terraform/Ansible) и понимание принципов;
  • Практический опыт построения CI/CD (Gitlab CI, Argo CD);
  • Понимание принципов работы систем мониторинга и алертинга, метрик и time series, построения графиков и т.д.;
  • Понимание методологии DevOps и опыт взаимодействия с Agile командами разработки;
  • Понимание Linux (Ubuntu) и работы с сетевым стеком (HTTP, TCP/IP, DNS, REST API);
  • Умение писать автоматизацию и скрипты на Python/Go;
  • Опыт работы с системами виртуализации и контейнеризации.

    Дополнительно приветствуем:
  • Понимание паттернов обеспечения отказоустойчивости - load balancing, circuit breakers, disaster recovery;
  • Понимание критериев доступности - SLO, SLI, SLA или общее представление о практиках SRE;
  • Опыт работы с Kubernetes, организации его мониторинга и владение Helm;
  • Опыт внедрения observability-as-code и alerting-as-code.

Условия

Комфортная среда

  • Оформление в соответствии с трудовым законодательством РФ;
  • Достойный уровень дохода: оклад + годовой бонус;
  • Расширенный ДМС со стоматологией;
  • Компенсация спорта;
  • Штатный терапевт и психолог;
  • Гибкий график работы, пятница – сокращенный рабочий день;
  • Классный офис в Москве;
  • Культура, в основе которой эмпатия, уважение, открытость и свобода строить рабочий процесс так, как считаешь нужным.

Место, где ты растешь

  • Индивидуальный план развития и обучение за счет компании;
  • Возможность вертикального и горизонтального роста;
  • Возможность развиваться как эксперту: выступать на мероприятиях, писать статьи.

Крутая команда

  • Профессиональные сообщества и клубы по интересам;
  • Неформальные мероприятия: от футбольного клуба до посиделок с пиццей.

Еще у нас

  • Льготная программа ипотечного и потребительского кредитования;
  • Материальная помощь при рождении детей и других семейных обстоятельствах;
  • Бонусы за рекомендации кандидатов на открытые вакансии.

откликнуться

Подходит вакансия? Оставь нам свое резюме и контактные данные