关联关系图谱——欺诈风险防范新工具
文/江苏银行风险管理部总经理徐劲 江苏银行风险管理部乔辉
近年来,金融犯罪和金融欺诈的新手段层出不穷,并已由过去的单兵作战演变成有规模、有组织的团伙欺诈。银行现有的反欺诈体系主要以专家规则为主,在防范新型的欺诈手段和欺诈形势时,存在两大痛点:一是无法识别个体正常但属于团伙欺诈的情形;二是缺乏对风险传导的防控。为解决上述痛点,江苏银行于2019年启动了基于关联关系图谱的反欺诈体系建设,相比传统的反欺诈体系,基于关联关系图谱的反欺诈体系在金融欺诈,尤其是团伙欺诈防范方面效果显著。本文将从关联关系图谱的建设背景、逻辑、效果以及展望四个方面进行阐述,希望对金融机构的反欺诈工作有一定的参考借鉴意义。
背景及应对
互联网、物联网、大数据的兴起和普及,正深刻改变着当前的金融生态和金融格局。在此宏观背景下,银行为了提高自身竞争力,降低运营成本,提高客户满意度,逐步向互联网业务转型。同时,当下的新冠肺炎疫情限制了原有的线下业务渠道,这也进一步加快了银行网上业务的转型步伐。虽然银行互联网业务具有收益高、成本低、体验好、方便快捷等优势,但是该业务因具有“无接触”的特点也导致客户欺诈风险的激增,这无疑对银行互联网业务的发展带来巨大的挑战。
当然,为防范欺诈风险,江苏银行构建了以规则为主的反欺诈体系,在防范欺诈风险方面已取得一定成效。以2019年为例,反欺诈规则有效拦截了3.4%的异常信息申请,发挥了有效初筛准入作用。但是,伴随欺诈手段和工具的多样化,金融欺诈呈现组织化、团伙化、隐蔽化的新趋势,现有反欺诈规则已然无法适应新型的欺诈形势。而关联关系图谱(以下简称“关联图谱”)则可以通过图分析技术深度挖掘客户潜在风险,能够有效解决现有反欺诈规则的不足,因此,为有效应对现有反欺诈规则的不足,江苏银行着力构建了基于关联图谱的反欺诈体系。
关联图谱技术识别欺诈风险的底层逻辑
关联图谱指由节点(实体)和节点之间错综复杂的关系构成的拓扑网络。所谓复杂关系就是基于时空数据、地址数据、人物数据构成的庞大的人-人关联、人-物关联的关系网络。关联图谱构建就是确认节点(实体)、关系(边)及权重,并基于动态Schema构建关系网络图的过程。节点(实体)包括但不限于:手机号码、身份证、银行卡、设备、IP等,关系(边)包括但不限于:家庭关系、担保关系、资金往来关系、设备关联、手机关联、家族关系、同事关系等,权重高低则依赖于关系强弱。
在反欺诈场景中,除了考虑单一信息点的属性,客户间的隐藏关联往往包含更多未知的潜在价值信息。因此,客户信贷欺诈行为的识别问题可以转化为关联图谱挖掘或社交网络分析问题。基于关联图谱的反欺诈体系旨在将多源异构的数据整合成机器可以理解的知识,将单点的信息转化为平面的相互关联的图谱,进行异常风险子图的监测,从而实现欺诈的识别与防御。
通过关联图谱进行反欺诈的最大优势在于:识别“个体正常”但属于欺诈的团伙,这也是目前银行进行反欺诈防范的最大痛点。团伙性欺诈一般涉及多个银行账号、客户和设备协同作案,在单笔申请、交易或者单个账户视角并不能看出任何风险,但是在建立多维度、多属性关联后(如账号交易关系、设备账号关系、担保关系、客户账号关系等),欺诈团伙往往呈现出明显的异常模式子图,并且已知的风险可通过关联关系进行传播扩散,关联网络能够发现更多风险关系和节点。而基于什么关系构建关联图谱,以及如何运用关联关系是关联分析的决定性因素。基于关联关系分析,可以将相同特征的人聚成群组,从而做批量分析和特征学习。在此基础上,进一步根据群组特征分析与挖掘,可以对特定人群制定特定的反欺诈策略。
关联图谱的应用
目前,江苏银行通过关联图谱技术初步实现了在客户画像、申请环节的欺诈团伙识别、信用卡养卡套现监测、贷后异常资金归集监测四个方面的应用。
1.单一客户全方位画像。整合全行零售客户的申请、交易、还款等信息,建立手机号、设备指纹、工作单位、pos机编号、账号等要素共现的关联图谱,打通了客户在各个业务场景下的数据,并刻画了客户的全方位画像,在此基础上挖掘单一客户的关联关系标签,并将标签应用到风控建模、客群营销等方面。
2.申请环节的欺诈团伙识别。基于构建的关联图谱,通过标签传播、风险传导等算法模型识别在网贷申请环节的可疑欺诈团伙,并实时推送业务系统排查,形成了一套完整的基于关联图谱的欺诈团伙识别、排查、确认机制。
3.信用卡养卡套现监测。通过遍历关联关系图谱的方式,根据养卡套现的共性特征(如养卡阶段消费的商户相对固定),识别可疑的信用卡养卡套现并推送业务人员进行排查、确认,同时联动业务系统,对确认的养卡套现客户进行止付、降额处置。
4.贷后异常资金归集监测。通过对关联关系图谱中包含的资金交易数据的挖掘,借助于模型识别图谱中异常的资金交易行为和异常交易团体,与相关业务系统联动排查风险。
下一步展望
下一步结合关联图谱的特点和优势,江苏银行将从精细化风险管理和精准化营销两个方面,对关联图谱的应用进一步深化。
1.精细化风险管理。一是客群区分的精细化。关联图谱建模时,应对客群进行精细化管理,提升风险识别的准确率。如养卡套现场景中,养卡套现的客户分为两类,一类为养卡套现欺诈客户,另一类为以卡养卡的套现客户,两类客户对银行的风险存在明显差异,应通过精细化管理,加强第一类客户识别的准确率。
二是图谱构建的精细化。关联图谱构建的关键是确定节点和关系边,应进一步丰富图谱构建的节点和关系边,比如增加地址信息、串号信息等,提高图谱构建的精细化程度,进一步提升关联图谱技术的优势和使用效率。
三是风险评分的精细化。通过评分的精细化,提升网贷申请欺诈团伙识别、信用卡养卡套现监测、异常资金归集监测的风险识别准确率。
2.精准化营销。一是深度挖掘营销客群的特征。欺诈是为了识别坏客户,而营销是为了识别好客户,其本质是相通的。实现精准化营销的重点突破口在于围绕“好用户”或者“高价值用户”的数据采集和特征工程开发领域,在各类不同营销场景下挖掘典型目标客户的各类基本属性和行为特征,并以此作为关联分析、聚类的依据,找到和他们相似的客群,为精准化的营销活动提供依据,最大化营销费用的投入产出比。
二是发展核心人物的自营销。利用关联图谱技术的特点和优势,识别团伙中的核心人物。在此基础上,向识别出的核心人物推送团体成员名单,由团体核心人物在团体成员间自行营销,根据营销成功的客户数量等指标给予相应的奖励。
三是次优人群的精准营销。目前银行获客成本越来越高,获客难度也越来越大,而在风险可控的前提下,发展存量客群中的次优人群则具有可行性。利用关联图谱的特点和优势,可以对符合次优特点的客户群体进行精准识别,其方式是:基于行内的优质种子客群,识别出与优质客群具有强关联关系的次优客群,对这部分次优人群进行进一步营销。