ML-разработчик (Inference)
Описание роли
В роли ML-разработчика (Inference) вы станете ключевым инженером, отвечающим за оптимизацию и масштабирование процессов инференса больших языковых моделей (LLM). Ваши основные задачи будут включать:
* Оптимизацию throughput и latency при генерации LLM: внедрение speculative decoding, continuous batching и работы с KV-cache.
* Тюнинг фреймворков (PyTorch, TensorRT, vLLM), работа с GPU-кластерами (CUDA, Tensor Cores) и профилирование узких мест.
* Разработку распределённых систем инференса: интеграцию с Kubernetes, сервис-мешами, балансировщиками, автоматическое масштабирование и поддержку multi-node tensor/pipeline parallel.
* Создание и оптимизацию низкоуровневых CUDA/Triton-ядр, профилирование памяти и вычислений, работа с NVLink и RDMA.
* Построение платформенных сервисов: API, SDK и инструментов для развёртывания, обновления и мониторинга моделей, поддержка on-prem и облачных сценариев.
Для участия важно понимание устройства трансформеров (attention, кэширование, последовательная генерация), опыт оптимизации инференса под GPU и навыки разработки на Python и C++ (или Go). Желателен опыт эксплуатации высоконагруженных сервисов под Kubernetes и gRPC.
Уникальность вакансии
* Работа в Yandex Cloud с передовыми технологиями для масштабируемого LLM-инференса.
* Гибридный формат: сочетание офиса в Москве и удалённой работы.
* Доступ к современным GPU-кластерам и инструментам профилирования.
* Возможность влиять на архитектуру распределённых вычислительных систем и развиваться в сфере AI/ML.
О компании
Yandex — ведущая технологическая компания, создающая облачные и AI-решения мирового уровня. В Yandex Cloud вы получите опыт работы над сервисами, обслуживающими миллионы запросов, и влияние на стратегические продукты. Компания ценит экспертизу, инновации и предоставляет сотрудникам возможности для профессионального роста и обучения.
Подписка TalentMove
Больше,
чем вакансии
→ TalentScanAI
Узнайте стоимость вашего опыта на рынке
→ Закрытое сообщество
Нетворкинг и инсайды рынка труда
→ Топ вакансии
Лучшие вакансии с доставкой в Telegram