Site Reliability Engineer для SRE
Что за роль
В этой роли вы будете отвечать за обеспечение надежности и доступности сервисов на bare metal с использованием Kubernetes. Работа включает в себя построение и поддержку систем наблюдаемости, реагирование на инциденты и устранение корневых причин проблем. Ваши основные задачи будут включать:
- Обеспечение надежности сервисов на bare metal с Kubernetes
- Строительство и поддержка observability с использованием Prometheus и Grafana
- Реакция на инциденты и проведение post-mortem анализа
- Тюнинг PostgreSQL и других баз данных под продакшен-нагрузку
- Поддержка CI/CD процессов и снижение времени деплоя
- Работа с сетевой инфраструктурой: маршрутизация и безопасность
Что важно знать
Данная позиция подразумевает работу в небольшой команде с высокими требованиями к надежности и производительности. Обязательно наличие опыта работы с bare metal и глубокое понимание Kubernetes. Условия работы включают обязательную релокацию в Абу-Даби после испытательного срока в 2 месяца, который проходит удаленно.
Подписка TalentMove
Больше,
чем вакансии
→ TalentScanAI
Узнайте стоимость вашего опыта на рынке
→ Закрытое сообщество
Нетворкинг и инсайды рынка труда
→ Топ вакансии
Лучшие вакансии с доставкой в Telegram