“与黑产团伙的斗争,永远是道高一尺,魔高一丈的博弈。”一位股份制银行风控部门人士赵强(化名)感慨说。
近日,他发现贷款欺诈行为正变得更加“隐蔽”——比如一家企业因资金周转困难,竟怂恿员工向银行申请个人消费贷款“纾困”。随着这些员工未能按时偿还贷款,银行方才发现这家企业早已因经营不善而倒闭,员工拿不到企业还款,也就无力偿还贷款。
“这让我们意识到,原先的大数据反欺诈风控模型或许已过时。”赵强表示。一直以来,银行通过跟踪信贷资金流向以防范欺诈风险的各项数据,主要通过表格方式存储呈现。但随着银行每日交易流水量达到百万级,传统的表格查询方式不但跟不上业务发展速度,极其“抽象”的呈现方式也令银行风控部门难以在海量数据(603138,股吧)里,精准捕捉贷款欺诈行为的蛛丝马迹。
记者多方了解到,随着贷款欺诈方式日益多元化与隐蔽化,越来越多银行机构也意识到传统大数据反欺诈技术的局限性,纷纷探索基于知识图谱(关系网络)的新型反欺诈技术。
“所以越来越多金融机构选择图数据库技术作为反欺诈模型的底层技术。”TigerGraph(维加星信息科技(上海)有限公司)解决方案顾问李憓松向记者透露。某种程度而言,图数据库技术好不好用,呈现的用户账户关系网络全不全,数据处理分析速度能否起到实时预警欺诈风险的效果,对银行持续升级反欺诈风控模型有着至关重要的作用。
所谓图数据库技术,主要是通过点和边的形式呈现人、地点、事物等数据是如何相互关联的,进而协助银行风控部门通过图分析技术,借助用户社会关系、交易模式关联、互联网行为、移动设备等数据特征,对客户行为模式进行匹配分析,精准判断客户是否存在贷款欺诈(或遭遇欺诈而申请贷款)的可能性。
“目前,不少银行基于图数据库技术,一面构建基于知识图谱(关系网络)的反欺诈风控模型,一方面则挖掘出新的反欺诈风控规则,在大幅提升欺诈行为预判精准性同时,有效抵御黑产团伙的频繁大规模攻击。”一位城商行风控部门主管向记者直言。比如在信用卡套现欺诈行为的侦测过程,他所在的银行采取多部图及高密子图侦测等方法,将代码运行时间从2-3周缩短为1小时,输出结果覆盖的黑样本(与黑产团伙相关的账户号码等)从总量的58%提高到77%,既提升了对欺诈行为的实时监测预警效率,也令更多欺诈行为变得无所遁形。
李憓松透露,当前图数据库技术还能有效搜索资金交易链路、回路等结构,在发现洗钱链路、套现团伙、反贷款欺诈等业务应用场景具有天然的优势。
银行与黑产团队的“斗智斗勇”再升级
记者多方了解到,随着科技发展,贷款欺诈方式也变得多元化——尤其是越来越多黑产团伙从原先的盗号,演变成使用大规模攻击、通过IP池等技术绕过风控规则实施贷款欺诈,导致金融机构遭遇的欺诈状况日益复杂,传统的大数据反欺诈模型变得“力不从心”。
“目前,黑产团伙还呈现专业化、产业化、隐蔽化、突发化的新特征。”赵强向记者指出。
所谓专业化,即黑产团队招募大量风控人员,专业黑客、AI专家等,通过大规模攻击等方式“反复测试”金融机构的反欺诈风控规则,一旦他们掌握这些风控规则且找出相应的漏洞,就会迅速制定针对性欺诈手段骗取巨额贷款资金。
产业化,则是贷款欺诈行为已从单个作案发展成团伙作案,即黑产团队通过获取大量账号进行大规模攻击,以实现欺诈收益最大化。
隐蔽化,即黑产团队跨境作案日益普遍,往往会利用IP池对身份进行洗牌,将交易链路变得更加复杂,从而令金融机构难以开展深层次数据挖掘以识别其中的欺诈风险。
突发化,是黑产团队账户号码一旦进入征信系统就迅速“作废”,迫使黑产团伙采取两种方式对这些账户号码进行最大化利用,一是用一个号码向多家银行等金融机构进行骗贷,二是使用很多账户在同一时间内,对银行等金融机构反欺诈规则漏洞进行大规模突击性攻击,若银行等金融机构不具备高实时性的反欺诈监测能力,就容易被“攻破”。
“这无形间对银行持续升级反欺诈风控模型提出更大的考验。”赵强强调说。目前他所说的银行反欺诈风控模型已出现某些技术性短板,一是对欺诈行为的数据监测分析存在“滞后性”——当银行发现欺诈行为踪迹时,有些欺诈行为已发生;二是反欺诈风控规则迭代更新速度偏慢,容易被黑产团队利用大规模攻击方式“洞察”其中秘密。
记者获悉,这驱动越来越多银行等金融机构开始尝试使用图数据库技术工具,构建反欺诈风控新模型。
李憓松告诉记者,已有多家银行使用TigerGraph图分析技术构建基于知识图谱的反欺诈模型。究其原因,一是TigerGraph实时图数据库能将不同数据源的万亿级数据进行集中处理,并提供实时查询能力,从而在贷款发放前识别欺诈行为;二是TigerGraph可以为机器学习提供图特征,对某些隐蔽性高的欺诈行为进行快速识别,比如通过对借款人的各类关系特征进行建模,对潜在的欺诈行为进行毫秒级实时甄别;三是图特征结合逻辑回归、决策树等机器学习算法所得到的预测分析结果比较容易理解,有助于银行风控人员加快反欺诈风控模型迭代升级进程。
“目前,图数据库技术已在某些金融反欺诈领域得到广泛应用。”他指出。比如根据业务人员以往经验,不少银行认为公司在获得贷款后的短时间内(比如3天内)将大部分贷款资金(贷款金额80%以上)转出,可能存在违规使用企业信贷资金购买房产的行为。于是这些银行采取图数据库技术,在全图上设置查询条件——(1)发放贷款与转出交易的时间差在3天内、(2)转出的总金额不小于贷款发放金额的80%,就能迅速得到符合上述条件的所有资金交易账户关联网络图,再快速识别资金是否流向存在买房行为的关联账户,及时阻止信贷资金违规流入楼市的行为。
“相比基于关系型数据库的查询,TigerGraph图查询的条件设置直观且简便,无论从分析结果呈现还是业务逻辑关联,都具有较强的可解释性。” 李憓松表示。
图数据库技术的“新挑战”
尽管越来越多银行开始将图数据库技术作为构建知识图谱反欺诈模型的重要抓手,但在实际操作环节,他们仍遇到不少操作痛点——比如某些金融科技公司提供的图数据库+大数据平台技术,难以扩展到多台机器、难以深度链接分析、不支持实时反欺诈预警等问题。
“因此,我们一直致力于创建操作简单且技术成熟的解决方案,彻底解决上述三大痛点。”李憓松向记者直言。在可扩展性和高性能方面,TigerGraph已能够支持万亿级别的关系网络处理和亚秒级查询;在易用性方面,TigerGraph则采用类SQL高级SDK,拥有图灵计算完备的表达力,支持以天计算的PoC(项目验证)能力;此外,TigerGraph还开发了基于浏览器的GraphStudio可视化开发工具,令银行等金融机构更容易使用图数据库技术清晰全面地呈现各类账户的关联网络,洞察其中的欺诈行为蛛丝马迹。
在业内人士看来,图数据库技术能否最大限度提升基于知识图谱的反欺诈模型运营效果,还取决于用户数据全面性。
“毕竟,用户数据是图分析的基础。若银行在遵循相关法律法规和监管要求的情况下,通过用户授权收集到更全面的个人数据,风控人员就能构建更完整的用户社会关系、交易模式关联、互联网行为、移动设备等图数据库,从而对用户行为模式开展更精准的匹配分析,对用户是否存在贷款欺诈(或遭遇欺诈而申请贷款)的判断会变得更准确。”上述城商行风控部门主管指出。然而,数据安全保护相关法规日益严格导致个人数据获取难度日益增加,对银行完善知识图谱反欺诈模型的数据积累构成相当大的挑战。
记者获悉,部分银行决定另辟蹊径——在数据量不足的情况下,利用图数据库技术将业务人员以往的反欺诈经验总结成众多风控规则,编写相应图数据库查询代码,令图数据库查询结果具有更大的覆盖度,从而协助风控部门提升资金流向追踪监控能力,在更大范畴与维度洞察各类潜在的贷款欺诈行为。
“目前,我们迫切需要构建大量全新的反欺诈风控规则,以确保我们的反欺诈风控模型始终领先黑产团伙,才能有效抵御他们大规模攻击行为。”赵强指出。
(邱光龙 HF056)