102810 вакансий +95 сегодня

ML-разработчик (Inference)

Описание роли

На позиции ML-разработчика (Inference) в Яндекс Cloud вы будете ключевым членом команды, занимающимся оптимизацией и масштабированием инференса больших языковых моделей (LLM). Ваша работа будет иметь непосредственное влияние на производительность сервисов, от которых зависит опыт миллионов пользователей. Вы получите возможность работать с передовыми технологиями и методами оптимизации, а также участвовать в разработке распределённых систем для инференса. Основные задачи включают улучшение throughput и latency, внедрение современных техник оптимизации и разработку API и SDK для разработчиков.

Ваши ключевые задачи:
— Оптимизация производительности инференса с использованием техник speculative decoding и continuous batching.
— Работа с фреймворками (PyTorch, TensorRT) и профилирование узких мест в GPU-кластерах.
— Разработка распределённых систем для инференса, интеграция с Kubernetes и автоматизация масштабирования.
— Низкоуровневая оптимизация и разработка кастомных ядер для повышения производительности.
— Разработка API и инструментов для разработчиков, автоматизация развертывания моделей.

Уникальность вакансии

Работа в Яндекс Cloud предоставляет уникальную возможность влиять на масштабируемость и производительность передовых ML-технологий. Вы будете работать в команде экспертов, использующих современные подходы и инструменты для достижения максимальной эффективности. Яндекс активно поддерживает инициативы по обучению и развитию сотрудников, предлагая доступ к ресурсам и материалам для профессионального роста. Формат работы гибридный, что позволяет сочетать офисное и удалённое взаимодействие, создавая комфортные условия для работы.

О компании Яндекс

Яндекс — ведущая IT-компания в России, предоставляющая широкий спектр продуктов и услуг в области поиска, облачных технологий и искусственного интеллекта. С более чем 10,000 сотрудников и миллионами пользователей в разных странах, Яндекс активно внедряет инновации и развивает свои сервисы. Компания занимается разработкой масштабируемых решений для бизнеса и частных пользователей, и её миссия — сделать информацию доступной и полезной для каждого. Яндекс известен своей корпоративной культурой, поддерживающей креативность и командную работу.

Партнёрское размещение. ERID 2W5zFHoQEpH Партнёрское размещение. ERID 2W5zFJWuthw
Оценка вакансии
8.5 / 10
Вакансия ML-разработчика в Яндекс Cloud предлагает интересные задачи по оптимизации инференса для больших языковых моделей, гибридный формат работы и конкурентную зарплату до 7000 USD. Присоединяйтесь к команде экспертов и развивайтесь в области AI!
Опубликовано:

Будьте в курсе новых вакансий

Подпишитесь на наш Telegram-канал

Мы используем cookie. Нажимая «ОК», вы принимаете Политику конфиденциальности и cookie.