Junior ML разметчик данных [Голосовая экосистема]
Описание роли
На позиции Junior ML разметчика данных в рамках голосовой экосистемы крупнейшего российского оператора МТС вы будете ключевым звеном в подготовке обучающих данных для моделей машинного обучения. Основная задача — разметка аудио и текстовых данных для повышения качества распознавания речи и понимания намерений пользователей. Вы будете:
* Анализировать аудиофайлы на наличие речи, шумов и фоновых помех;
* Транскрибировать фрагменты разговоров и выделять ключевые слова и намерения;
* Размечать шумовые сегменты и классифицировать типы фоновых звуков;
* Переходить к текстовой разметке: классификация пользовательских запросов, валидация продуктовых описаний, проверка соответствия данных требованиям;
* Работать с инструментами разметки (Label Studio) и файловыми хранилищами (Amazon S3).
Уникальность вакансии
Вы присоединитесь к проекту по развитию голосового ассистента и чат-бота МТС — одного из самых масштабных в России. Ваша работа напрямую влияет на качество голосового сервиса, которым пользуются миллионы абонентов. Мы предлагаем:
* Реальную практику с большими данными и современными ML-пайплайнами;
* Обучение внутри команды: опытные коллеги проведут мастер-классы по Label Studio и S3;
* Четкое наставничество и план развития карьеры в области AI-аннотации;
* Доступ к внутренним документациям и обучающим материалам по машинному обучению.
О компании МТС
МТС — лидер телекоммуникационного рынка с более чем 30-летней историей. Мы активно инвестируем в AI и ML-разработки, внедряем голосовые технологии для клиентского сервиса и умного дома. Наши инженеры создают продукты, которые упрощают жизнь миллионов пользователей, а внутренние проекты по автоматизации и анализу данных регулярно получают отраслевые награды.
Подписка TalentMove
Больше,
чем вакансии
→ TalentScanAI
Узнайте стоимость вашего опыта на рынке
→ Закрытое сообщество
Нетворкинг и инсайды рынка труда
→ Ранний доступ к beta
Попробуйте новые инструменты поиска