Разработка и оптимизация моделей нейронных сетей для решения задач компании;
Написание кода на Python с использованием современных фреймворков (TensorFlow, PyTorch, Keras и др.);
Работа с большими наборами данных: предобработка, аугментация и анализ данных;
Интеграция моделей машинного обучения в существующие системы и приложения;
Исследование и внедрение новейших алгоритмов и подходов в области машинного обучения и глубокого обучения;
Оптимизация производительности моделей и их развертывание на различных платформах;
Сбор и подготовка данных, очистка, нормализация и построение признаков мошенничества, формирование фичей и агрегатов;
Построение ML моделей в области противодействия мошенничеству;
Разработка ML алгоритмов и фичей для систем транзакционного и сессионного антифрода и их адаптация под тренды мошенничества;
Тестирование и проверка гипотез, выявления аномалий, сбалансированности не сбалансированности классов;
Валидация ML моделей по целевым метрикам для выявления отклонений в работе моделей и фичей, митигация ложно - положительных срабатываний по кейсам мошенничества;
Взаимодействие с другими командами: С аналитиками - для понимания новых сценариев мошенничества. С инженерами backend - для встраивания моделей в транзакционную и сессионные системы антифрода;
Документирование и описание работы моделей;
Ставить ML-задачи и определять подходящий для них стек ML-моделей;
Собирать и предобрабатывать датасеты для обучения моделей;
Разрабатывать ML-модели c нуля, исследовать мировой опыт, тестировать гипотезы, проводить эксперименты для повышения качества и сравнивать разные подходы;
Разрабатывать и поддерживать LLM-пайплайны: от промпт-инжиниринга до RAG и построения агентных систем;
Интегрировать модели в существующую инфраструктуру и поддерживать их;
Настраивать мониторинг качества модели и бизнес-метрик, проводить диагностику проблем, поддерживать стабильность запущенных решений;
Участвовать в проектировании ML-решений;
Тестировать и оценивать влияние ML-решений на бизнес-метрики;
Документировать модели, эксперименты и процессы разработки;
Исследовать и внедрять новые ML-подходы для защиты инфраструктуры;
Знания и навыки
Понимание основ статистики, техник машинного обучения в частности глубокого обучения, а также опыт работы с какими-то конкретными задачами. Важна не супер-глубина, сколько умение решать задачу относительно целей и ограничений;
Хорошие технические познания в Python, опыт с другими языками тоже приветствуются;
Знания основ CS: алгоритмы и структуры данных (не на уровне олимпиадников, а на уровне опыта применения);
Знаете SQL или готовы его изучить;
Знание и опыт применения математики в ML моделировании: теория вероятности, временные ряды, математическая статистика, линейная алгебра, математический анализ, теория информации, оптимизация, векторная математика;
Обладаете фундаментальными знаниями в области математики, алгоритмов и структур данных, прикладной статистики;
Знание и опыт построения ML моделей (бинарная классификация), проведения разведочного анализа данных, предобработки признаков, генерации признаков;
Знание языка программирования Python и библиотек Python для ML и анализа данных: Seaborn, Pandas, Matplotlib ,NumPy , SciPy, Optuna;
Знание SQL на уровне middle ( хранимые процедуры, оконные операции, таблицы представления);
Уверенно владеете ML, DL и современными подходами к работе с LLM: fine-tuning, RAG, промпт-инжиниринг, агенты;
Умеете программировать на Python, знаете стандартные библиотеки и фреймворки для ML/AI;
Умеете работать с Git и Docker;
Умеете строить гипотезы на основе данных и улучшать модели с учетом обратной связи от пользователей и заказчиков;
Опыт работы в области ML моделирования от 3 лет;
Опыт использования подходов в ML: XGBoost, Random forest, Gradient boosting;
Опыт работы в командах c agile/kanban процессами;
Опыт работы с Linux-based ОС, Docker;
Опыт орекестрации пайплайнов : Airflow, Kuberflow;
Дополнительно
Будет плюсом высшее техническое образование и опыт работы в индустриальных ML-проектах, включая этап доставки предсказаний и моделей до прода;
Будет плюсом опыт разработки LLM-пайплайнов и агентных систем, опыт создания end-to-end-пайплайнов — от сбора данных до оценки моделей с циклом их дообучения;