ML-инженер в ИБ

Обязанности

  • Разработка и оптимизация моделей нейронных сетей для решения задач компании;
  • Написание кода на Python с использованием современных фреймворков (TensorFlow, PyTorch, Keras и др.);
  • Работа с большими наборами данных: предобработка, аугментация и анализ данных;
  • Интеграция моделей машинного обучения в существующие системы и приложения;
  • Исследование и внедрение новейших алгоритмов и подходов в области машинного обучения и глубокого обучения;
  • Оптимизация производительности моделей и их развертывание на различных платформах;
  • Сбор и подготовка данных, очистка, нормализация и построение признаков мошенничества, формирование фичей и агрегатов;
  • Построение ML моделей в области противодействия мошенничеству;
  • Разработка ML алгоритмов и фичей для систем транзакционного и сессионного антифрода и их адаптация под тренды мошенничества;
  • Тестирование и проверка гипотез, выявления аномалий, сбалансированности не сбалансированности классов;
  • Валидация ML моделей по целевым метрикам для выявления отклонений в работе моделей и фичей, митигация ложно - положительных срабатываний по кейсам мошенничества;
  • Взаимодействие с другими командами: С аналитиками - для понимания новых сценариев мошенничества. С инженерами backend - для встраивания моделей в транзакционную и сессионные системы антифрода;
  • Документирование и описание работы моделей;
  • Ставить ML-задачи и определять подходящий для них стек ML-моделей;
  • Собирать и предобрабатывать датасеты для обучения моделей;
  • Разрабатывать ML-модели c нуля, исследовать мировой опыт, тестировать гипотезы, проводить эксперименты для повышения качества и сравнивать разные подходы;
  • Разрабатывать и поддерживать LLM-пайплайны: от промпт-инжиниринга до RAG и построения агентных систем;
  • Интегрировать модели в существующую инфраструктуру и поддерживать их;
  • Настраивать мониторинг качества модели и бизнес-метрик, проводить диагностику проблем, поддерживать стабильность запущенных решений;
  • Участвовать в проектировании ML-решений;
  • Тестировать и оценивать влияние ML-решений на бизнес-метрики;
  • Документировать модели, эксперименты и процессы разработки;
  • Исследовать и внедрять новые ML-подходы для защиты инфраструктуры;

Знания и навыки

  • Понимание основ статистики, техник машинного обучения в частности глубокого обучения, а также опыт работы с какими-то конкретными задачами. Важна не супер-глубина, сколько умение решать задачу относительно целей и ограничений;
  • Хорошие технические познания в Python, опыт с другими языками тоже приветствуются;
  • Знания основ CS: алгоритмы и структуры данных (не на уровне олимпиадников, а на уровне опыта применения);
  • Знаете SQL или готовы его изучить;
  • Знание и опыт применения математики в ML моделировании: теория вероятности, временные ряды, математическая статистика, линейная алгебра, математический анализ, теория информации, оптимизация, векторная математика;
  • Обладаете фундаментальными знаниями в области математики, алгоритмов и структур данных, прикладной статистики;
  • Знание и опыт построения ML моделей (бинарная классификация), проведения разведочного анализа данных, предобработки признаков, генерации признаков;
  • Знание языка программирования Python и библиотек Python для ML и анализа данных: Seaborn, Pandas, Matplotlib ,NumPy , SciPy, Optuna;
  • Знание SQL на уровне middle ( хранимые процедуры, оконные операции, таблицы представления);
  • Умение обрабатывать данные, понимание ETL процессов;
  • Уверенно владеете ML, DL и современными подходами к работе с LLM: fine-tuning, RAG, промпт-инжиниринг, агенты;
  • Умеете программировать на Python, знаете стандартные библиотеки и фреймворки для ML/AI;
  • Умеете работать с Git и Docker;
  • Умеете строить гипотезы на основе данных и улучшать модели с учетом обратной связи от пользователей и заказчиков;
  • Опыт работы в области ML моделирования от 3 лет;
  • Опыт использования подходов в ML: XGBoost, Random forest, Gradient boosting;
  • Опыт работы в командах c agile/kanban процессами;
  • Опыт работы с Linux-based ОС, Docker;
  • Опыт орекестрации пайплайнов : Airflow, Kuberflow;

Дополнительно

  • Будет плюсом высшее техническое образование и опыт работы в индустриальных ML-проектах, включая этап доставки предсказаний и моделей до прода;
  • Будет плюсом опыт разработки LLM-пайплайнов и агентных систем, опыт создания end-to-end-пайплайнов — от сбора данных до оценки моделей с циклом их дообучения;