Специалист по машинному обучению (ML-engineer, Data Scientist)
Описание роли
В роли Специалиста по машинному обучению вы будете ключевым участником команды автоматизации документооборота. Ваша основная задача — разработать и внедрить локальный конвейер обработки скан-образов (счета-фактуры, договоры, акты, ТТН) для автоматического распознавания, классификации и извлечения ключевых атрибутов (дата, номер, контрагент, ИНН и др.) с последующей записью данных в базу. Вы будете работать с предобученными эмбеддингами (BERT) и настраивать модели NER для точного извлечения элементов, а также интегрировать OCR-систему Tesseract и реализовывать пост-обработку результатов.
Особенности вакансии
* Полноценный цикл ML-проекта: от подготовки данных и OCR → очистка текста → векторизация до интеграции моделей через API.
* Локальная развертка в изолированной среде Docker без доступа к интернету, что позволяет работать с конфиденциальными документами.
* Гибридный формат: часть времени в офисе в Москве или Щербинке, часть — удалённо после успешного прохождения испытательного срока.
* Интересные и разнообразные задачи: работа с небольшими размеченными выборками (50–200 документов) и достижение высокой точности (>85%).
* KPI-ориентированная система премирования, которая поощряет качественные результаты и своевременные релизы.
О компании МПК
МПК — российская компания, специализирующаяся на разработке решений для автоматизации бизнес-процессов и документооборота. Наша миссия — повышать скорость и точность обработки данных в финансовом, логистическом и юридическом секторах. Среди проектов МПК — внедрение локальных ML-конвейеров у крупных промышленных и ритейл-компаний. Мы ценим инновационный подход, командную работу и ответственность за результат.