Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!
В предыдущих сериях... (предыстория)
Читатель, впервые столкнувшийся с творчеством Лаборатории машинного обучения на Хабре, задается справедливым вопросом: «Да кто такие эти ваши нэйросэти в банковских задачах?». Тем временем в Альфа-Банке нейросети применяются уже несколько лет и приносят банку сотни миллионов рублей ежегодно. Подробно изучить наш опыт можно из цикла статей про построение нейросетевых моделей на временных последовательных данных: карточных транзакциях, транзакциях расчетного счета и данных из БКИ. В этой главе дам лишь небольшое резюме.
Наши модели мы строим на временных последовательных данных, которые накапливаются в банковском контуре: транзакциях, кредитных историях, чеках ОФД, логах мобильного приложения и др. На этих данных мы обучаем нейросети с архитектурой, которая позволяет извлекать информацию из произвольной последовательности событий без дополнительного этапа генерации фичей.
Первым процессом, в который нам удалось внедрить нейросети, стал кредитный скоринг. Быстро стало ясно, что подходы легко масштабируются и на «соседние» задачи – предсказание склонности клиентов к банковским продуктам и оттока.
Заинтересовало и хотите изучить подробнее?
Присоединяйтесь к бесплатному курсу DL in Finance на Stepik.org. Вы узнаете, как при помощи нейронных сетей можно значительно улучшить метрики в классических банковских задачах: кредитный скоринг, склонность к продуктам и предсказание оттока.
Многократное повторение упражнения по обучению модели под некоторый таргет позволило:
с одной стороны, выработать довольно универсальные архитектуры и техники обучения для каждого домена данных (текущий стандарт модели на последовательных данных мы описали в статье про
триединую нейросетевую модель);а с другой, досыта наесться повторением одних и тех же шагов.
Однако, заботливых рук нейросетевых моделей ждут еще множество других бизнес-процессов банка…
Десять джунов?..
Извечный вопрос – что делать? Здесь, как водится, есть два стула… С одной стороны, можно нанять десяток неискушенных джунов и посадить их переобучать модели под новые целевые переменные. С другой стороны, можно попробовать как-то автоматизировать этот процесс. И перед тем, как отвечать на вопрос, на какой стул сядешь, а на какой… кхм… не сядешь, давайте поговорим, а чем же так плох первый путь.
В первую очередь ручная разработка и внедрение нейросетей (да и вообще любых ML-моделей, даже типичных) – долгий и трудоемкий процесс. Типичный жизненный цикл нейросетевой модели на последовательных данных выглядит следующим образом: