Инженер SRE / DevOps в финтех-проект

Оплата: По договоренности

Удаленно

Full-time

Part-time

Bash Python Ansible AWS IoT

Мы — крупная технологическая компания, один из лидеров российского финтех-рынка. Мы создаем и развиваем сложные цифровые продукты, которыми ежедневно пользуются миллионы людей. Наша культура основана на инженерном подходе, постоянном развитии и автоматизации. Мы не боимся экспериментировать и внедрять передовые технологии, а также разрабатывать собственные уникальные решения для достижения максимальной производительности и надежности наших систем.

Чем предстоит заниматься

- Проектировать, внедрять и поддерживать высокодоступную и отказоустойчивую инфраструктуру для банковских приложений.

- Развивать и поддерживать конвейеры CI/CD для автоматизации сборки, тестирования и развертывания сервисов.

- Внедрять и совершенствовать комплексные системы мониторинга (логи, метрики, трейсинг) для проактивного обнаружения и решения проблем.

- Заниматься задачами масштабирования сервисов и инфраструктуры под постоянно растущие нагрузки.

- Автоматизировать рутинные задачи администрирования и эксплуатации с помощью скриптов и инструментов IaC (Infrastructure as Code).

- Управлять конфигурациями, используя такие инструменты, как Ansible, Terraform.

- Участвовать в процессе определения и контроля метрик надежности (SLO/SLI) и бюджетов ошибок (Error Budgets).

- Проводить "post-mortem" анализ инцидентов и разрабатывать меры для их предотвращения в будущем.

- Консультировать команды разработки по вопросам архитектуры, производительности и надежности их приложений.

Наш идеальный кандидат

- Обладаете опытом работы на позиции SRE инженера / DevOps инженера от 3 лет в компаниях с высоконагруженными системами.

- Понимаете специфику работы в финансовой отрасли и требования к безопасности и надежности систем (опыт в финтехе будет большим плюсом).

- Уверенно работаете с Linux на уровне администратора и имеете опыт написания скриптов (Bash, Python).

- Имеете практический опыт работы с системами контейнеризации и оркестрации (Docker, Kubernetes).

- Знакомы со стеком мониторинга: Prometheus, Grafana, ELK/Loki.

- Работали с системами CI/CD (например, GitLab CI, Jenkins, TeamCity).

- Понимаете принципы Infrastructure as Code (IaC) и имеете опыт с Terraform или Ansible.

- Глубоко разбираетесь в сетевых протоколах и принципах работы сетей, готовы к сложным диагностическим задачам.

Будет преимуществом

- Опыт работы с облачными провайдерами (например, Yandex.Cloud, AWS, GCP).

- Опыт построения систем disaster recovery (аварийного восстановления).

- Знание принципов GitOps.

- Опыт работы с базами данных (PostgreSQL, ClickHouse) с точки зрения эксплуатации и производительности.