Инженер по мониторингу
Описание роли
На позиции Инженера по мониторингу вы будете отвечать за создание, развитие и поддержку системы наблюдаемости для ключевых финансовых сервисов. Ваша задача — обеспечить круглосуточное отслеживание метрик, логов и трейсов, оперативное реагирование на инциденты и предотвращение сбоев. Вы спроектируете и внедрите архитектуру мониторинга с нуля, используя открытые решения и собственные наработки компании.
Ключевые задачи:
* Развертывание и поддержка Prometheus, Grafana и Zabbix для сбора метрик и визуализации данных;
* Настройка алертинга, SLA/SLO/SLI, интеграция с системами оповещений (Slack, Telegram, e-mail);
* Сбор, хранение и анализ логов и трейсов через Opensearch для быстрого поиска и корневого анализа;
* Участие в инцидент-менеджменте: быстрый ответ на инциденты, проведение постмортем-анализа и выработка рекомендаций;
* Обеспечение отказоустойчивости и масштабируемости систем наблюдения, автоматизация процессов деплоя и обслуживания;
* Взаимодействие с командами разработки и инфраструктуры для повышения надёжности сервисов;
Особенности вакансии
CommCloud — аккредитованная ИТ-компания с более чем пятилетним опытом работы с критически важными финансовыми системами. Мы предлагаем:
* Полностью удалённый формат работы в рамках ТК РФ с гибким началом рабочего дня;
* Конкурентную «грязную» зарплату 150–200 000 RUB с возможностью пересмотра по результатам первых трёх месяцев;
* Современный стек инструментов и право самому предлагать и внедрять новые решения;
* Работа в небольшой кросс-функциональной команде без бюрократии и микроменеджмента;
* Льготная ипотека и отсрочка от армии для IT-специалистов;
* Возможность участия в профильных конференциях и сертификациях (CNCF, Elastic, Grafana Labs).
О компании CommCloud
CommCloud специализируется на сопровождении и развитии высоконагруженных инфраструктур для ведущих финансовых организаций России. За пять лет работы мы реализовали десятки успешных проектов для банков, платёжных систем и страховых компаний. Наша миссия — обеспечить максимальное время безотказной работы критически важных сервисов и внедрять практики SRE в российском финтехе. Команда ценит инициативу, экспертизу и готовность брать ответственность за результат. Мы развиваем собственные инструменты для анализа телеметрии и открыты к любым эксперементам, которые повышают стабильность и безопасность решений.
Подписка TalentMove
Больше,
чем вакансии
→ TalentScanAI
Узнайте стоимость вашего опыта на рынке
→ Закрытое сообщество
Нетворкинг и инсайды рынка труда
→ Топ вакансии
Лучшие вакансии с доставкой в Telegram