SRE
Описание роли
На позиции SRE (Site Reliability Engineer) в компании Hostkey вы отвечаете за обеспечение высокого уровня надежности, отказоустойчивости и доступности наших хостинговых и виртуализационных платформ. Вашей ключевой задачей будет определение и контроль показателей SLI/SLO, разработка и оптимизация CI/CD процессов, а также внедрение подходов GitOps для автоматизации инфраструктуры и ускорения релизов.
Ваши обязанности:
* Управление надежностью и доступностью критически важных сервисов: определение, контроль и улучшение SLI/SLO;
* Проектирование, разработка и оптимизация GitLab CI/CD пайплайнов; внедрение практик GitOps с использованием FluxCD или ArgoCD;
* Настройка и развитие систем мониторинга, логирования и трейсинга (Jaeger, OTLP, Coroot);
* Организация и проведение процессов реагирования на инциденты, разработка ранбуков и участие в On-Call ротации;
* Проектирование стратегий резервного копирования и восстановления (Backup/DR);
* Прогнозирование нагрузки, проведение capacity planning, анализ производительности и оптимизация ресурсов;
* Участие в проектировании отказоустойчивых архитектур с балансировкой нагрузки, фейловером и резервированием;
* Взаимодействие с командами разработки для повышения надежности, масштабируемости и наблюдаемости сервисов;
* Поддержка blue/green и canary деплоев, автоматизация откатов и минимизация даунтайма.
Уникальность вакансии
Вы получите возможность работать в международной компании, предоставляющей высоконагруженные VPS и выделенные сервера с 2008 года. Hostkey предлагает:
* Отсутствие бюрократии и свободный выбор инструментов;
* Performance Review и грейд-ап каждые 6 месяцев;
* Оплачиваемое обучение и сертификации по профилю;
* Гибкость: полностью удаленная работа или офис в Москве рядом с метро «Электрозаводская»;
* Возможность оформления по ТК РФ или через ИП.
О компании Hostkey
Hostkey — это один из лидеров на рынке хостинга и виртуализации с площадками в России, США, Европе и Азии. Мы обслуживаем более 30 000 VPS и 15 000 выделенных серверов по всей планете. Главные ценности компании — надежность, инновации и оперативная поддержка клиентов. Наши инженеры работают с современными облачными технологиями и открыты к экспериментам, что позволяет быстро вводить новые решения для бизнеса.
Подписка TalentMove
Больше,
чем вакансии
→ TalentScanAI
Узнайте стоимость вашего опыта на рынке
→ Закрытое сообщество
Нетворкинг и инсайды рынка труда
→ Ранний доступ к beta
Попробуйте новые инструменты поиска