ML-разработчик (Inference)
Описание роли
На позиции ML-разработчика (Inference) в Яндекс Cloud вы будете ключевым членом команды, занимающимся оптимизацией и масштабированием инференса больших языковых моделей (LLM). Ваша работа будет иметь непосредственное влияние на производительность сервисов, от которых зависит опыт миллионов пользователей. Вы получите возможность работать с передовыми технологиями и методами оптимизации, а также участвовать в разработке распределённых систем для инференса. Основные задачи включают улучшение throughput и latency, внедрение современных техник оптимизации и разработку API и SDK для разработчиков.
Ваши ключевые задачи:
— Оптимизация производительности инференса с использованием техник speculative decoding и continuous batching.
— Работа с фреймворками (PyTorch, TensorRT) и профилирование узких мест в GPU-кластерах.
— Разработка распределённых систем для инференса, интеграция с Kubernetes и автоматизация масштабирования.
— Низкоуровневая оптимизация и разработка кастомных ядер для повышения производительности.
— Разработка API и инструментов для разработчиков, автоматизация развертывания моделей.
Уникальность вакансии
Работа в Яндекс Cloud предоставляет уникальную возможность влиять на масштабируемость и производительность передовых ML-технологий. Вы будете работать в команде экспертов, использующих современные подходы и инструменты для достижения максимальной эффективности. Яндекс активно поддерживает инициативы по обучению и развитию сотрудников, предлагая доступ к ресурсам и материалам для профессионального роста. Формат работы гибридный, что позволяет сочетать офисное и удалённое взаимодействие, создавая комфортные условия для работы.
О компании Яндекс
Яндекс — ведущая IT-компания в России, предоставляющая широкий спектр продуктов и услуг в области поиска, облачных технологий и искусственного интеллекта. С более чем 10,000 сотрудников и миллионами пользователей в разных странах, Яндекс активно внедряет инновации и развивает свои сервисы. Компания занимается разработкой масштабируемых решений для бизнеса и частных пользователей, и её миссия — сделать информацию доступной и полезной для каждого. Яндекс известен своей корпоративной культурой, поддерживающей креативность и командную работу.
Подписка TalentMove
Больше,
чем вакансии
→ TalentScanAI
Узнайте стоимость вашего опыта на рынке
→ Закрытое сообщество
Нетворкинг и инсайды рынка труда
→ Топ вакансии
Лучшие вакансии с доставкой в Telegram