Senior Data Scientist (Speech Lab)
Описание роли
На позиции Senior Data Scientist в Speech Lab компании Контур вы будете отвечать за полный цикл разработки высокоточных моделей автоматического распознавания речи и обработки естественного языка. В рамках роли ваши ключевые задачи включают:
• Разработку и обучение акустических моделей ASR для потокового и пакетного распознавания речи с учётом реальных шумовых условий и ограничений по задержке.
• Исследование и внедрение современных архитектур языковых моделей (NLP) для улучшения качества транскрипции и контекстного понимания.
• Создание и оптимизацию алгоритмов декодирования, рескоринга и post-processing, обеспечение интеграции моделей в программные компоненты продукта.
• Построение и сопровождение пайплайнов подготовки датасетов: сбор, аннотация, балансировка классов, проверка качества и воспроизводимости экспериментов.
• Проведение экспериментальных исследований, анализ результатов, оформление выводов в формате научных статей и докладов для внутренних и внешних конференций.
• Взаимодействие с междисциплинарной командой инженеров, лингвистов и data-ассессоров для повышения точности и надёжности продуктов.
Уникальность вакансии
Вы получите возможность работать в крупной технологической компании с собственным исследовательским центром, где ценят научный подход и поощряют публикации. Особенности предложения:
• Гибридный формат работы: сочетание удалённых дней и комфортного офиса в одном из крупнейших городов России.
• Своя асессорская служба для оперативного создания качественных датасетов и аннотаций.
• Доступ к вычислительным ресурсам и инфраструктуре Triton Inference Server для масштабирования онлайн-сервисов.
• Участие в международных конференциях IEEE, Interspeech и возможность совместных публикаций.
• Конкурентная заработная плата и социальный пакет по ТК РФ, включая ДМС и льготное обучение.
О компании Контур
Контур — лидер в области B2B SaaS-решений для автоматизации бизнес-процессов в России и СНГ. Компания разрабатывает продукты для электронного документооборота, налоговых отчётов, цифровых подписей и анализа больших данных. Speech Lab — инновационное подразделение, фокусированное на применении передовых ИИ-алгоритмов для задач распознавания и синтеза речи. Контур ценит командную работу, открытость знаний и поддержку профессионального роста сотрудников.