Middle+/Senior Data Scientist
Описание роли
В команде NLP Core 2ГИС вы попадёте в центр разработки интеллектуальных сервисов по работе с текстовыми данными и LLM-моделями. Ваша ключевая задача — проектировать и поддерживать конвейеры для автоматизированного извлечения и валидации информации о компаниях, товарах и отзывах. Вы будете отвечать за:
• Добычу и агрегацию данных из множества источников, включая веб-скрейпинг и API-подключения;
• Построение и обучение моделей на базе PyTorch и Hugging Face Transformers для классификации, кластеризации и генерации текста;
• Разработку и интеграцию LLM-решений (vLLM, LangChain, LlamaIndex) для финотюнинга и ускоренного вывода;
• Поддержание качества данных: детектирование и фильтрацию неподходящих отзывов, автоматическую категоризацию и нормализацию описаний;
• Внедрение end-to-end пайплайнов от прототипа до микросервисов в продакшене, включая CI/CD и мониторинг.
Уникальность вакансии
Работа в 2ГИС сочетает удалённый формат и гибкий график с доступом к реальным данным тысяч городов. Вы получите возможность:
• Работать с крупными корпусами региональных и глобальных данных, влияя на качество поиска и рекомендации;
• Использовать передовые методы обработки естественного языка и генерации контента, включая fine-tuning LLM;
• Взаимодействовать с кросс-функциональными командами инженеров, аналитиков и продакт-менеджеров;
• Посещать профильные конференции и обучаться за счёт компании, обмениваясь опытом с лучшими практиками в отрасли.
О компании 2ГИС
2ГИС — это российская компания, создающая картографический сервис и каталог компаний для миллионов пользователей. Миссия — помочь людям быстрее находить нужные места и услуги. Компания активно внедряет технологии больших данных и искусственного интеллекта, имеет распределённые команды разработчиков и исследователей. Среди достижений — собственные решения в области автоматической геолокации, рекомендации и чат-ботов на базе LLM.
Подписка TalentMove
Больше,
чем вакансии
→ TalentScanAI
Узнайте стоимость вашего опыта на рынке
→ Закрытое сообщество
Нетворкинг и инсайды рынка труда
→ Ранний доступ к beta
Попробуйте новые инструменты поиска