ML Data Engineer
Описание роли
На позиции ML Data Engineer вы станете ключевым специалистом, отвечающим за построение и поддержку масштабируемых дата-пайплайнов для обучения и развёртывания моделей машинного обучения. Ваша задача — обеспечить бесперебойный сбор, очистку и обработку больших объёмов данных, в том числе изображений и аннотаций, для последующей работы компонентов генерации изображений и Computer Vision. Вы будете тесно взаимодействовать с командой разработчиков и исследователей ML, чтобы гарантировать качество и актуальность данных для обучения.
Обязанности
* Проектирование, разработка и оптимизация ETL-процессов для сбора и обработки данных;
* Интеграция разнородных источников (SQL/NoSQL, хранилища файлов, внешние API);
* Предобработка и аннотирование датасетов изображений для задач Computer Vision;
* Настройка и управление инструментами оркестрации (Airflow, Luigi) и контейнеризации (Docker);
* Автоматизация мониторинга качества данных и метрик пайплайнов;
* Сотрудничество с командами ML Research и DevOps для развёртывания моделей в облаке (AWS/GCP).
Требования
* Опыт работы от 3 лет в Data Engineering и ML-сервисах;
* Уверенные навыки Python, SQL, опыт с Airflow или аналогичными системами;
* Знания TensorFlow, PyTorch или других ML-фреймворков;
* Практика работы с Docker, Kubernetes и облачными платформами AWS/GCP;
* Опыт обработки и аннотирования данных изображений;
* Умение оптимизировать производительность пайплайнов и баз данных.
Условия
* Офис в центре Лондона, современное рабочее место;
* Полная занятость, гибкий график 40 часов в неделю;
* Корпоративная медицинская страховка и система бонусов;
* Бюджет на обучение, участие в профильных конференциях и сертификациях;
* Возможность карьерного роста до Lead ML Engineer или Team Lead;
* Дружелюбная атмосфера международной команды.
Особенности вакансии
* Работа с большими объёмами изображений и метаданных для передовых моделей генерации;
* Влияние на архитектуру дата-инфраструктуры и выбор технологий;
* Использование современных подходов CI/CD и Infrastructure as Code;
* Перспектива участия в исследовательских проектах и публикаций результатов.
О компании
Recraft — это инновационный стартап, создающий AI-инструменты для профессиональных дизайнеров, иллюстраторов и маркетологов. Платформа Recraft устанавливает новые стандарты качества генерации изображений с помощью нейросетей, упрощая рабочие процессы и повышая креативность команд по всему миру. Компания ценит экспертизу, открытость к новым идеям и предоставляет возможность работать над амбициозными проектами в международной среде.