CRT LLM Engineer (Python, RAG)
Описание роли
На позиции LLM Engineer вы будете ответственны за развёртывание и поддержку современных LLM-моделей в корпоративном контуре, а также за интеграцию искусственного интеллекта в редактор презентаций. Вы создадите и оптимизируете RAG-системы, обеспечите дообучение моделей методами LoRA и QLoRA, а также снизите затраты на токены за счёт оптимизации запросов к API. Ключевые задачи:
– Разворачивать и поддерживать LLM-модели (Qwen, Llama, Mistral и аналоги)
– Проектировать и реализовывать RAG-системы для поиска и генерации контента
– Интегрировать модели в основной продукт: редактор презентаций
– Выполнять дообучение LLM-моделей (LoRA, QLoRA)
– Оптимизировать запросы к модели для снижения расхода токенов
– Писать и актуализировать техническую документацию
Уникальность вакансии
Это отличный шанс стать частью высокотехнологичного B2B SaaS-стартапа с ежедневной аудиторией около 20 000 пользователей. Мы предлагаем официальное трудоустройство по Трудовому кодексу, гибкий график 5/2 с возможностью выбора времени начала и окончания рабочего дня, а также плановое повышение заработной платы в течение первых двух лет. Вакансия сочетает удалённый формат и работу с передовыми технологиями AI: Python, LLM, RAG, LoRA и QLoRA, что позволит вам постоянно развиваться в сфере ML и NLP.
О компании
CRT — аккредитованная IT-компания, специализирующаяся на создании сервиса для быстрого и качественного производства презентационных материалов. Наша система обрабатывает большие объёмы данных в реальном времени и поддерживает высокую нагрузку, обеспечивая бесперебойную работу для 20 000 пользователей ежедневно. Мы ценим профессионализм, инновации и стремление к совершенству: лучшие решения в области AI и ML формируют основу нашего продукта.