Principal Site Reliability Engineer
Что за роль
В этой роли вы будете формировать подход к Site Reliability Engineering (SRE) в компании Copperco, определяя ключевые принципы надежности, наблюдаемости и операционного совершенства. Основные задачи включают внедрение принципов SRE, создание систем и процессов для измерения этих принципов, таких как SLIs, SLOs и бюджеты ошибок.
Что предстоит делать:
- Определять и внедрять принципы SRE в организации.
- Автоматизировать процессы для повышения надежности систем и скорости развертывания.
- Участвовать в жизненном цикле микросервисов от создания до развертывания и непрерывного улучшения.
- Сотрудничать с инженерными и продуктовыми командами для интеграции надежности в процесс разработки.
- Наставлять инженеров по практикам SRE и проводить безвинные постмортемы для улучшения управления инцидентами.
Что важно знать
Эта позиция требует глубоких знаний в проектировании и анализе распределенных систем, а также в управлении инцидентами. Вы будете работать в удаленной команде, что подразумевает высокую степень автономии и ответственности. Если у вас есть опыт работы с AWS и интерес в области блокчейн-технологий, это будет большим плюсом.
Подписка TalentMove
Больше,
чем вакансии
→ TalentScanAI
Узнайте стоимость вашего опыта на рынке
→ Закрытое сообщество
Нетворкинг и инсайды рынка труда
→ Ранний доступ к beta
Попробуйте новые инструменты поиска