ML Engineer Middle+
Описание роли
В роли ML Engineer Middle+ вы станете ключевым специалистом команды KVINT, отвечающей за создание и внедрение передовых LLM-моделей для голосовых ассистентов. Вы будете участвовать в оптимизации существующих алгоритмов, адаптации opensource LLM под задачи звонков на русском языке и разработке эффективных механизмов инференса. Работа подразумевает тесное взаимодействие с domain-экспертами и back-end разработчиками, а также регулярный анализ качества модельных решений в условиях высоких нагрузок.
Уникальность вакансии
Компания KVINT предлагает возможность реализовать собственные идеи и получить поддержку при внедрении инноваций без избыточной бюрократии. Вы получите полный доступ к современным инструментам: PyTorch, Docker и Nvidia Triton Server. Проект федерального масштаба обеспечивает не только стабильность, но и шанс внести вклад в развитие AI-технологий на национальном уровне. Гибкий менеджмент и отсутствие жестких регламентов позволят вам самостоятельно выстраивать процесс работы и учиться у лучших специалистов отрасли.
О компании
KVINT — амбициозная IT-компания, специализирующаяся на разработке решений для автоматизации голосовых сервисов. Мы верим в силу искусственного интеллекта и вкладываем ресурсы в развитие экспертизы сотрудников, организуя внутренние образовательные сессии и привлекая лидеров рынка для обмена опытом. Наши успешные проекты доказали эффективность AI-интеграций в телекоммуникационной сфере и получили высокие оценки партнеров.
Обязанности
— Разработка и оптимизация LLM-моделей для голосовых ассистентов, включая процесс fine-tuning под особенности телефонного домена;
— Настройка и масштабирование сервисов инференса, обеспечение балансировки нагрузки и быстрого отклика;
— Проведение стресс-тестирования и мониторинг производительности моделей в реальном времени;
— Интеграция системы обновления базы знаний на основе многоформатных документов для поддержки диалоговых сценариев.
Требования
— Уверенные навыки программирования на Python, опыт в Data Science;
— Глубокое владение PyTorch и Docker;
— Практический опыт работы с LLM (prompt engineering, fine-tuning);
— Знание методов глубокого обучения и NLP для обработки текстовых данных;
— Опыт работы с векторными базами данных;
— Желателен опыт дистилляции и прунинга нейронных сетей;
— Приветствуется знакомство с Nvidia Triton Server.
Условия
— Полностью удаленный формат работы с гибким графиком и свободой выбора инструментов;
— Работа в сплоченном коллективе профессионалов и регулярное обучение в предметной области;
— Участие в крупном федеральном проекте с перспективами профессионального роста;
— Конкурентная заработная плата и обсуждение дополнительных бонусов на собеседовании;
— Возможность реализовывать инициативы и влиять на архитектуру решений.
Подписка TalentMove
Больше,
чем вакансии
→ TalentScanAI
Узнайте стоимость вашего опыта на рынке
→ Закрытое сообщество
Нетворкинг и инсайды рынка труда
→ Ранний доступ к beta
Попробуйте новые инструменты поиска