92823 вакансии +438 сегодня

Специалист 3-й линии сопровождения ML-сервисов

200,000 - 220,000 RUB

Описание роли

В качестве специалиста 3-й линии сопровождения ML-сервисов вы будете отвечать за бесперебойную работу и развитие высоконагруженных приложений на основе машинного обучения. Основная задача — оперативное решение инцидентов, внедрение изменений и оптимизация производительности систем, построенных на Kubernetes и Docker. Вы взаимодействуете с командами разработки, тестирования и эксплуатации, гарантируя стабильность и масштабируемость сервисов.
Ваши ключевые обязанности:
* Поддержка ML-сервисов на уровне 3-й линии: расследование и устранение критических инцидентов, выполнение изменений и обновлений;
* Сопровождение инфраструктуры заказчика: настройка и поддержка кластеров Kubernetes, контейнеров Docker, сетевых компонент и хранилищ данных;
* Участие в релизном цикле: подготовка окружений, автоматизация развертывания, проверка корректности новых версий;
* Проектирование и обновление архитектуры с учётом требований отказоустойчивости, масштабирования и безопасности;
* Оптимизация использования ресурсов (GPU/CPU/RAM), балансировка нагрузки и резервирование;
* Взаимодействие с DevOps- и ML-командами для выработки лучших практик эксплуатации;
* Документирование процессов, создание и поддержка внутренних инструкций по эксплуатации и аварийному восстановлению.

Требования к кандидату

* Опыт сопровождения высоконагруженных систем от 3 лет;
* Глубокие знания контейнеризации и оркестрации: Docker, Kubernetes;
* Понимание микросервисных архитектур и event-driven паттернов;
* Владение сетевыми протоколами, принципами безопасности и базами данных (SQL, NoSQL);
* Навыки оптимизации ресурсов и мониторинга (Prometheus, Grafana);
* Умение работать с CI/CD-процессами и автоматизацией развертываний.

Дополнительным плюсом:
* Опыт работы с BigData-технологиями и корпоративными хранилищами;
* Знание принципов HA/Fault Tolerance, балансировки и резервирования;
* Практика настройки распределённых вычислений на кластерах GPU.

Условия и преимущества

* Полностью удалённый формат работы из любой точки РФ;
* Оформление по ТК РФ в аккредитованную ИT-компанию;
* Предоставление техники по требованиям проекта;
* Социальный пакет: ДМС, фитнес, корпоративные активити;
* Участие в масштабных проектах AI/Big Data с ведущими командами отрасли;
* Возможность профессионального роста и обмена опытом на профильных конференциях;
* Дружная команда и культура поддержки знаний внутри компании.

Оценка вакансии
6.2 / 10
Вакансия предлагает ключевую роль в поддержке сложной ML-инфраструктуры с фокусом на контейнеризацию и отказоустойчивость. Полностью удалённый формат, достойная зарплата и работа с передовыми технологиями делают её привлекательной для инженеров уровня Middle+.
Опубликовано:

Будьте в курсе новых вакансий

Подпишитесь на наш Telegram-канал

Мы используем cookie. Нажимая «ОК», вы принимаете Политику конфиденциальности и cookie.