Data Scientist по NLP + LLM
Что за роль
В этой роли вы будете проектировать и поддерживать полный цикл улучшения медицинских LLM. Основная задача — сбор, очистка, версионирование данных, обучение и дообучение моделей. Вам предстоит строить датасеты и контуры разметки, а также разрабатывать LLM-based пайплайны для медицинских задач.
Что предстоит делать:
• Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning). • Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias. • Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails. • Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде. • Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации.
Что важно знать
Вам предстоит работать в сильной команде профессионалов, увлеченных своей работой. Офис находится в Сити с панорамным видом на город, а гибридный формат работы позволяет сочетать офисные и удаленные дни. Мы предлагаем медицинскую программу, включая телемедицинские консультации и оплату профильного обучения.
О компании СберЗдоровье
СберЗдоровье — ведущая MedTech-компания России, фокусирующаяся на разработке технологий для улучшения доступа к медицинским услугам.
Подписка TalentMove
Больше,
чем вакансии
→ TalentScanAI
Узнайте стоимость вашего опыта на рынке
→ Закрытое сообщество
Нетворкинг и инсайды рынка труда
→ Ранний доступ к beta
Попробуйте новые инструменты поиска