Как клиентский скоринг помогает бороться с отмыванием денег

Источник McKinsey & Company. Время чтения 7 минут.

На сегодняшний день легализация средств, полученных преступным путем, является одной из самых серьезных экономических проблем, которая, по разным подсчетам, затрагивает от 2 % до 5 % мирового ВВП. Несмотря на тот факт, что финансовые учреждения по всему миру инвестируют миллиарды долларов на борьбу с всевозможными видами отмывания денег, штрафы, налагаемые на эти учреждения за несоблюдение требований финансовой безопасности, продолжают расти. Так, за 9 лет (с 2008 по 2017 год) их общий объем составил $321 млрд. (только за один 2016 год данный показатель достиг $42 млрд. ). Это означает, что не только регулирующие органы работают более эффективно, но и преступники становятся все более и более изощренными. 

Решением данной проблемы является скоринг клиентов. Однако зачастую результаты подобных оценок достаточно неточны, что влечет за собой большое количество ошибок (клиенты с низким уровнем риска классифицируются как ненадежные и наоборот).  В итоге организациям приходится досконально перепроверять результаты анализа, даже в ситуациях, когда это не требуется. Это приводит к увеличению стоимости скоринга, раздражает большинство благонадежных клиентов чрезмерной тщательностью проверок и ослабляет эффективность борьбы с отмыванием денег из-за необходимости перенаправлять финансовые ресурсы. 

В то же время как регулирующие органы, так и финансовые учреждения по всему миру поощряют инновационные подходы к скорингу клиентов. Многие организации уже внедрили методики, о которых пойдет речь в данной статье. Они объединили два важнейших финансовых инструмента: проверку клиентов и мониторинг проводимых ими операций. Главным преимуществом новой методики является сокращение уровня ошибок от 25 % до 50 %, а также более эффективное использование финансовых ресурсов.

Передовые практические методы скоринга клиентов включают в себя:

  • упрощение архитектуры моделей
  • улучшение качества данных
  • внедрение статистического анализа в дополнение к заключениям экспертов
  • постоянное обновление профилей клиентов с учетом их активности
  • внедрение технологии машинного обучения и новых методов  машинного обучения

Упрощение архитектуры моделей

Большинство существующих программ чрезмерно сложны и включают в себя слишком большое количество факторов, которые могут повлиять не результат скоринга. И при этом они до сих пор не являются всеобъемлющими и полными!

В соответствии с новым подходом, ведущие компании подходят к вопросу создания скоринговых программ более целостно, сначала приводят все модели в соответствии с согласованным набором факторов риска, а затем определяют конкретные вводимые данные, которые будут актуальны для каждого направления деятельности организации. Данный подход позволяет достигнуть наибольшей эффективности, поскольку разные индустрии могут совместно инвестировать в программы, необходимые для разработки инструментов, подходов, стандартов и каналов передачи данных.

Улучшение качества данных

Низкое качество данных является основной причиной плохой работы скоринговых программ, в частности, во многих учреждениях это привело  тому, что более половины рассмотренных случаев были ошибочно отнесены к категории высокого риска.

Однако решить данную проблему достаточно сложно, посколько зачастую установить источник неудовлетворительных данных бывает весьма затруднительно. Однако алгоритмы машинного обучения могут осуществлять всесторонний поиск по подсегментам данных для определения того, где сконцентрированы проблемы качества, помогая таким образом их выявлять и даже решать. Иногда может помочь обработка данных на естественном языке (NLP). Как пример, один из банков обнаружил, что многие случаи были классифицированы как “высокий риск, подлежит пересмотру”, так как клиенты указывали род деятельности как “врач” или “терапевт”, а система признавала только «врача» в качестве профессии. Алгоритмы NLP были использованы для проведения семантического анализа и быстрого исправления проблемы, что помогло сократить более чем на 10 процентов количество нерассмотренных дел. В более долгосрочной перспективе, однако, решение заключается в глобальном улучшении качества данных.

Внедрение статистического анализа в дополнение к заключениям экспертов

Финансовые учреждения традиционно полагаются на помощь экспертов и на рекомендации регулирующих органов при определении исходных данных, используемых для оценки рисков и принятия решений о том, как именно их анализировать. Однако различный вклад разных экспертов вносит ненужную сложность и приводит к появлению множества ненужных, исключительных правил. Кроме того, поскольку оценка рисков в значительной степени зависит от профессионального опыта экспертов, проверить их актуальность или точность может быть крайне затруднительно.

Статистически калиброванные модели, как правило, значительно проще. И, что немаловажно, они более точны, поскольку генерируют значительно меньше ложноположительных случаев высокого риска. Благодаря данной технологии набор уже имеющихся данных может быть использован для калибровки параметров скоринговых моделей, прибегая к таким методам статистического анализа как регрессия.  

Крайне важно, чтобы выборка, рассмотренная экспертами, содержала достаточное количество случаев, связанных с высоким риском, и чтобы рейтинг был подвергнут коллегиальной оценке для устранения любой необъективности.

Поэтому эксперты по-прежнему играют важную роль в разработке скоринговых моделей. Они обладают наилучшей квалификацией для определения факторов риска, которые могут использоваться программой в качестве отправной точки. Эксперты также могут выявить поддельные исходные данные, которые могут быть получены только в результате статистического анализа. Однако статистические алгоритмы определяют оптимальные коэффициенты для каждого фактора риска, обеспечивают фактологическую базу для устранения неинформативных входных материалов, а также упрощают скоринговую модель, например, путем удаления сопоставительных данных.

Постоянное обновление профилей клиентов с учетом их активности

Сегодня большинство скоринговых программ основаны на профилях клиентов, например, их места жительства или профессии. Однако содержащаяся в них информация может достаточно быстро терять свою актуальность, так как большинство финансовых организаций предполагают, что клиенты будут самостоятельно обновлять персональную информацию, хотя потребители, как правило, делают это крайне редко. Более эффективная модель оценки рисков постоянно обновляет информацию о клиентах. 

Еще одна проблема, связанная с клиентскими профилями в целом, заключается в их ограниченной ценности, если учреждения в равной степени не рассматривают активность и поведение человека. Было обнаружено, что простое знание профессии клиента или, например,  используемых им банковских продуктов не обязательно повышает ценность модели с точки зрения прогнозирования. Более показательным является то, соответствует ли поведение клиента при совершении операций тому, что можно было бы ожидать от него в данной профессии, или тому, как клиент использует тот или иной продукт.

Так, например, практика показывает, что активные клиенты банков, как правило, подвержены меньшему риску, а это означает, что потребители, у которых уже имеется расчетный счет вкупе с другими банковскими продуктами более благонадежны. Количество личных посещений банка может также помочь более точно определить, представляет ли клиент с расчетным счетом высокий риск, как и его поведение в отношении финансовых операций (их количество и сумма, а также любая другая схожая активность). Соединяя информацию, полученную с помощью моделей мониторинга операций, с моделями оценки риска клиентов, можно значительно повысить эффективность всего скоринга.

И хотя статистически калиброванные модели оценки риска работают лучше, чем модели с ручной настройкой, машинное обучение может еще больше повысить эффективность скоринга клиентов.

Внедрение технологии машинного обучения и инструментов науки о сетях

Список возможных исходных данных для построения моделей очень обширен, и многие из них соотносятся и соответствуют разным степеням риска. Все это может быть проанализировано с помощью технологий машинного обучения. Алгоритм отбора признаков не содержит допущений и может просматривать тысячи исходных данных, чтобы помочь определить наиболее релевантные функции, а переменная кластеризация может удалить избыточные исходные данные. Алгоритмы предсказательной аналитики (например, деревья решений и AdaBoost( усиление классификаторов)) могут помочь выявить наиболее прогнозируемые факторы и комбинированные показатели клиентов с высоким риском (например, тех, кто пользуется только одним финансовым продуктом, кто не платят по счетам, но выводят огромные суммы на международный рынок). Кроме того, программы машинного обучения могут построить конкурентоспособные эталонные модели для проверки точности, и, как упоминалось выше, они могут помочь исправить проблемы с качеством данных.

Наука о сетях также может стать крайне мощным инструментом для скоринга. В данном случае речь идет об объединении внутренних и внешних данных с целью выявления сетей, которые, при их соотношении с уже известными типами высокого риска, могут быть использованы в качестве входных данных для скоринг-моделирования. Например, обычный процесс банковского мониторинга отмывания денег не будет подбирать различные связи между четырьмя или пятью счетами, постоянно появляющимися небольшими нерегулярными депозитами, которые затем подключаются к торговому счету для покупки активов, допустим,  лодки.  Индивидуальная деятельность не является тревожным сигналом, так как различные клиенты могут просто покупать лодки у одного и того же продавца. Однако стоит лишь добавить больше данных, например, GPS координаты обычно используемых банкоматов, и операции начнут выглядеть подозрительно из-за выявленной связи между счетами. Подобный анализ может выявить новые, важные входные данные для моделей скоринга.Как, например, оценка связей различных, которая измеряет риск структурирования транзакций, т.е. регулярного перевод небольших сумм, предназначенных для избегания пороговых значений при мониторинге переводов средств.

Хотя подобный подход может быть крайне полезен, важно, чтобы модели оставались прозрачными. Эксперты должны понимать аргументы, лежащие в основе решений, принимаемых в рамках той или иной модели, и следить за тем, чтобы они не были предвзятыми по отношению к определенным группам клиентов. Многие организации экспериментируют с подходами к машинному обучению в сочетании с методами обеспечения прозрачности, которые объясняют, почему модель классифицирует клиентов как людей с высоким риском.

Что делать дальше?

Некоторые банки уже внедрили многие из пяти передовых методов. Другим нужно двигаться дальше.

Некоторые лишь используют модели, которые настраиваются вручную и периодически анализируют профиль клиента. Следующим этапом становится использование регулярно обновляющейся клиентской информации для более точной оценки риска. Третий шаг еще более сложен. Чтобы дополнить информацию из профилей клиентов, учреждения используют сетевую аналитику для построения поведенческого представления о том, как деньги перемещаются по счетам клиентов. Оценки риска клиентов вычисляются с помощью машинного обучения с использованием методов прозрачности для объяснения результатов и ускорения скоринга. Данные клиентов постоянно обновляются, в то время как внешние данные, такие как записи о собственности, используются для выявления потенциальных проблем с качеством данных и определения приоритетов для их устранения.

Финансовые учреждения могут предпринять практические шаги, чтобы начать свой путь к третьему этапе — процессу, который может занять от 12 до 36 месяцев (см. боковую панель «Путь к сложным моделям оценки рисков»).

Вывод:

По мере того, как способы отмывания денег становятся все более изощренными и дорогостоящими, финансовые учреждения должны давать отпор новаторским контрмерам. Среди наиболее эффективных видов оружия можно назвать передовые скоринг-модели. Они более точно фиксируют подозрительных лиц и виды деятельности, применяя машинное обучение и статистический анализ для получения более качественных данных и актуальных профилей клиентов и их поведения. Такие модели могут значительно уменьшить количество ложноположительных результатов и обеспечить концентрацию ресурсов там, где они будут иметь наибольший эффект в борьбе с отмыванием денег. Финансовым учреждениям, которые берут на себя обязательство разработать и поддерживать подобные сложные скоринг-модели, необходимо будет посвятить свое время и ресурсы на протяжении от одного года до трех лет, в зависимости от исходной точки каждого учреждения. Тем не менее, этот путь необходим, так как только благодаря ему преступникам будет сложнее отмывать деньги.