ML-разработчик (Inference)
Описание роли
На позиции ML-разработчика (Inference) в команде ML-сервисов Yandex Cloud вы будете отвечать за всю цепочку оптимизации и развертывания инференс-сервисов для больших языковых моделей (LLM). Ваша ключевая задача — обеспечить высокую производительность (throughput и latency) при генерации текстовых ответов, используя передовые методы: speculative decoding, continuous batching, KV-cache и другие.
Вы будете заниматься:
* Тюнингом фреймворков (PyTorch, TensorRT, vLLM) и написанием кастомных CUDA/Triton-ядр для ускорения ключевых операций.
* Профилированием на GPU-кластерах: выявление «узких мест» и оптимизация памяти и вычислений.
* Разработкой и развитием распределённых систем инференса на Kubernetes с поддержкой multi-node сценариев (tensor/pipeline parallel).
* Интеграцией сервисов с балансировщиками нагрузки и автоскейлингом, обеспечивая отказоустойчивость и масштабируемость.
* Созданием платформенных инструментов (API, SDK) для автоматизации развёртывания, обновления моделей и поддержки on-prem сценариев у клиентов.
Эта позиция подойдёт вам, если вы любите глубоко разбираться в устройствах трансформеров, готовы работать на уровне low-level (CUDA/Triton) и строить сложные распределённые решения для LLM-инференса.
Особенности вакансии
* Гибридный формат работы: сочетание офиса и удалёнки, гибкий график.
* Работа в одном из лидирующих облачных провайдеров России с возможностью влиять на стратегические продукты.
* Доступ к топовым GPU-кластером и новым технологиям ускорения (NVLink, RDMA).
* Участие в международных R&D-инициативах, командные хакатоны и внутренние конференции.
* Конкурентная зарплата, прозрачная система оценки и регулярные пересмотры.
О компании Яндекс
Яндекс — ведущая технологическая компания, развивающая экосистему сервисов для поиска, рекламы, карт, облачных вычислений и машинного обучения. Миссия компании — сделать информацию максимально доступной и полезной для пользователей по всему миру. В Yandex Cloud команда ML-сервисов работает над инновационными продуктами на стыке Data Science, DevOps и распределённых систем, обеспечивая стабильность и масштабируемость решений для тысяч корпоративных клиентов.
Подписка TalentMove
Больше,
чем вакансии
→ TalentScanAI
Узнайте стоимость вашего опыта на рынке
→ Закрытое сообщество
Нетворкинг и инсайды рынка труда
→ Топ вакансии
Лучшие вакансии с доставкой в Telegram