Инженер по надежности системы для SRE
Что за роль
В этой роли вы будете отвечать за надежность и доступность сервисов на bare metal с Kubernetes. Ищем инженера, который понимает каждый слой инфраструктуры и способен поддерживать стабильность под нагрузкой.
Что предстоит делать:
• Обеспечивать надежность и доступность сервисов на bare metal с Kubernetes. • Строить и поддерживать систему наблюдаемости (Prometheus, Grafana, Loki). • Реагировать на инциденты и проводить post-mortem. • Тюнить PostgreSQL и другие БД под продакшен-нагрузку. • Поддерживать CI/CD процессы и снижать время деплоев. • Работать с сетевой инфраструктурой: маршрутизация, балансировка нагрузки. • Взаимодействовать с командой разработки и инженерами клиентов.
Что важно знать
Роль требует глубоких знаний bare metal и Kubernetes, а также опыта устранения инцидентов под давлением. Идеальный кандидат должен быть готов брать на себя ответственность за стабильность систем и иметь высокий уровень автономности в работе с незнакомым стеком.
Подписка TalentMove
Больше,
чем вакансии
→ TalentScanAI
Узнайте стоимость вашего опыта на рынке
→ Закрытое сообщество
Нетворкинг и инсайды рынка труда
→ Топ вакансии
Лучшие вакансии с доставкой в Telegram