ML-инженер (видеохостинг, highload)
- NM TEAM SOCIAL MEDIA APPLICATIONS DEVELOPMENT & MANAGEMENT CO. L.L.C
- Полностью удаленно
- Middle
- Полная занятость
- 3-5 лет
Описание роли
В роли ML-инженера вы будете ответственны за полный цикл создания, развёртывания и поддержки машинно-обученных моделей в высоконагруженном видеохостинге. Вы настроите и оптимизируете ML-фичи для скоринга контента, сегментации пользователей и рекомендации потокового видео. Задачи включают проектирование и автоматизацию ETL-пайплайнов, интеграцию моделей в продакшн через MLOps-процессы, контейнеризацию и мониторинг, а также участие в разработке системы A/B-тестирования моделей.
Уникальность вакансии
Компания предлагает работать с международными командами без бюрократии и ограничений: свободный график, полная удалёнка, свобода выбора инструментов и железа. Вы получите возможность выстроить с нуля масштабируемую data-инфраструктуру на базе Airflow/Prefect/Luigi и организовать хранение данных в S3 и ClickHouse. Впервые в проектах видеохостинга будете создавать ML-инструменты для анализа frame-by-frame, видеоэмбеддингов и обработки аудио- и текстовых данных с использованием ffmpeg и NLP.
О компании
NM TEAM SOCIAL MEDIA APPLICATIONS DEVELOPMENT & MANAGEMENT — международная компания, специализирующаяся на разработке и управлении социальными медиа-приложениями и видеохостингами. Главная миссия — дать миллионам пользователей по всему миру простой и безопасный доступ к видео-контенту, используя передовые алгоритмы машинного обучения и высоконагруженные распределённые системы. В компании ценят экспертизу, самостоятельность и инициативность: здесь вы сможете влиять на архитектуру продукта и процесс принятия решений.
Обязанности:
• Разработка и внедрение ML-моделей для скоринга видео и текстового контента;
• Построение и оптимизация ETL-пайплайнов от ingestion до подготовки обучающих выборок;
• Проектирование ML-фич в сотрудничестве с продуктовой и инженерной командами;
• Настройка CI/CD для моделей, контейнеризация (Docker) и мониторинг в продакшне;
• Участие в системе A/B-тестирования, сбор метрик и анализ результатов.
Требования:
• Уверенные навыки Python и опыт работы с ML/Data-инфраструктурой;
• Отличное знание SQL и опыт оптимизации запросов к PostgreSQL;
• Опыт оркестрации задач Airflow, Prefect или Luigi;
• Знание принципов MLOps: CI/CD, контейнеризация, мониторинг пайплайнов;
• Опыт работы с MLflow/DVC/W&B и версионированием моделей;
• Навыки работы с видеоданными (ffmpeg, видеоэмбеддинги) и базовые знания NLP.
Условия:
• Полностью удалённая работа из любой точки мира;
• Свободный график и отсутствие жёсткого контроля времени;
• Возможность использовать собственное оборудование и ПО;
• Минимум административной нагрузки, максимальная автономия;
• Работа на международном облачном софте без ограничений.