92834 вакансии +438 сегодня

Middle+/Senior Data Scientist

200,000 - 400,000 RUB

Описание роли

В команде NLP Core 2ГИС вы попадёте в центр разработки интеллектуальных сервисов по работе с текстовыми данными и LLM-моделями. Ваша ключевая задача — проектировать и поддерживать конвейеры для автоматизированного извлечения и валидации информации о компаниях, товарах и отзывах. Вы будете отвечать за:
• Добычу и агрегацию данных из множества источников, включая веб-скрейпинг и API-подключения;
• Построение и обучение моделей на базе PyTorch и Hugging Face Transformers для классификации, кластеризации и генерации текста;
• Разработку и интеграцию LLM-решений (vLLM, LangChain, LlamaIndex) для финотюнинга и ускоренного вывода;
• Поддержание качества данных: детектирование и фильтрацию неподходящих отзывов, автоматическую категоризацию и нормализацию описаний;
• Внедрение end-to-end пайплайнов от прототипа до микросервисов в продакшене, включая CI/CD и мониторинг.

Уникальность вакансии

Работа в 2ГИС сочетает удалённый формат и гибкий график с доступом к реальным данным тысяч городов. Вы получите возможность:
• Работать с крупными корпусами региональных и глобальных данных, влияя на качество поиска и рекомендации;
• Использовать передовые методы обработки естественного языка и генерации контента, включая fine-tuning LLM;
• Взаимодействовать с кросс-функциональными командами инженеров, аналитиков и продакт-менеджеров;
• Посещать профильные конференции и обучаться за счёт компании, обмениваясь опытом с лучшими практиками в отрасли.

О компании 2ГИС

2ГИС — это российская компания, создающая картографический сервис и каталог компаний для миллионов пользователей. Миссия — помочь людям быстрее находить нужные места и услуги. Компания активно внедряет технологии больших данных и искусственного интеллекта, имеет распределённые команды разработчиков и исследователей. Среди достижений — собственные решения в области автоматической геолокации, рекомендации и чат-ботов на базе LLM.

Оценка вакансии
5.1 / 10
Вакансия Middle+/Senior Data Scientist в 2ГИС предлагает широкий спектр NLP-задач: добычу и категоризацию данных, валидацию и модерацию с помощью LLM. Удалённая работа на современном стеке PyTorch, HF Transformers и LangChain, гибкий график и перспективы развития внутри инновационной компании.
Опубликовано:

Будьте в курсе новых вакансий

Подпишитесь на наш Telegram-канал

Мы используем cookie. Нажимая «ОК», вы принимаете Политику конфиденциальности и cookie.