近日,由中国互联网金融协会金融科技发展与研究专委会编著的《隐私计算与金融数据融合应用》一书出版,撰写支持单位包括华控清交、北京金杜律师事务所、美团、陆金所、光大银行(601818)、阳光保险金科集团、德勤,书中聚焦隐私计算与金融数据融合应用,对其法律制度、技术选择,以及典型场景进行了梳理,并就风险挑战提出对策建议。
该书指出,在依法合规和安全可控的前提下,推动数据融合应用有助于在金融领域发挥数据要素的倍增作用,同时,由多方计算、联邦学习等技术手段及其组合形成的方案工具箱也不断丰富,然而,由于各种因素的综合作用,全球金融领域对此类新型解决方案的实践探索仍相对较少。
鉴于此,该书在典型场景一章,选择了银行、证券、保险、监管科技、各层级数据融合平台建设等领域的部分代表性场景,结合具体场景的业务背景、数据融合应用痛点及相关技术特点,提出具有探索价值的针对性解决方案设想。其中,银行业的典型场景便是科创企业信用评估。
轻资产企业评估困境
与传统企业相比,科创企业有3个明显的特征:轻资产、没有规范的财务报表、资金需求量大。而传统银行信贷风控更倾向于实物抵(质)押,对科创企业发展潜力、人才储备、技术能力等“软信息”的评估和精细化分析能力往往存在不足。
目前,银行在向科创企业提供融资支持时主要采用供应链金融模式、担保贷款模式和投贷联动三种方式,这三种方式下,银行都需要在线下从与科创企业信用评估相关的数据方处获取信息,进行风险判断,发放贷款。
但是,科创企业信用评估替代数据分散割裂,难以整合。除财务数据(体现运营能力、偿债能力、盈利能力等数据)外,企业登记信息(包括创业者信息、股东特征)、知识产权(发明/专利/许可)、纳税、供应链产业链(上下游企业/交易规模)、用工(数量/结构/薪酬水平)、融资(股权/债权)、行政处罚、涉诉信息等数据对判断科创企业信贷风险尤为重要,但这些数据分散在市场监管、专利、税务、工信、司法、劳动、科技等部门,且各部门之间数据壁垒高、“信息孤岛”问题严重。
以知识产权质押融资为例,科创企业的知识产权是能体现其发展潜力的重要无形资产,银行目前以“重人力”的方式通过第三方中介机构,如知识产权中心、第三方评估机构、律师事务所对企业本身和质押的知识产权进行核查和担保,但是知识产权的权属关系、法律状态(如仿冒、假冒等)、年检情况等变动风险高,各中介机构更新数据的速度滞后,使银行评估知识产权价值的成本居高不下。
而从企业自身角度来讲,科创企业属于创新性企业,其商业机密信息普遍蕴含巨大的增长价值,因此往往严格保护重要信用评估数据,以防止不当泄露对自身商业利益造成重大损害。
以研发数据为例,对创新药开发的创业公司来讲,研发实力是企业未来得以生存的核心竞争力,大部分医药企业都不愿意对自身研发支出、研发进展信息进行过多披露,避免让竞争对手得知相关信息进而影响自身发展。这种做法的结果直接降低了银行识别企业风险的精准度。
如何才能解决这些痛点从而将银行沉淀的数据与能够评估科创企业信用状况的数据融合起来,进行联合风控授信建模呢?该书提出的技术解决方案便是通过多方计算纯密文建模。
通过多方计算纯密文建模解决
该书指出,在上述场景中,可存在多种技术方案。例如,可将联邦学习用于联合建模,并结合多方计算技术进行安全加强;也可直接利用多方计算技术,进行纯密文建模。因为科创企业数据体量总体不高,较为适合采用多方计算纯密文建模。
参与机构在业务流程中的角色可分为数据的输入节点、计算节点和输出节点。其中,计算节点应由相对固定且互相独立的多家可信权威机构组成,可避免单一计算节点掌握全部输入因子(并非原始数据);输入、输出节点根据业务需要动态调整,确保仅业务相关方参与数据融合过程。
一般而言,融合过程可分为3个环节:
一是数据输入环节。各输入节点对所掌握的科创企业信用评估数据如财务数据、知识专利数、研发人员占比、税务数据等进行数学交换,并将变换后密码学安全的输入因子提交至多方计算引擎。这一过程原始数据本身并未进入数据接入节点。
二是数据计算环节。多方计算引擎对输入因子进行预处理后分发至各计算节点,确保每个计算节点仅能获取到单个输入节点输入因子的部分“切片”。各计算节点完成各自计算后将结果提交至计算引擎,由多方计算引擎将计算结果切片后分发给若干计算节点(每个计算节点仅能收到部分切片,即输出因子。)
三是数据输出环节,输出节点对输出因子进行处理,获取明文融合结果(如关于该科创企业的信用评分)供业务系统使用。完成后,各计算节点销毁计算因子、计算中间结果和最终结果数据。
该方案的价值在于,对科创企业来讲,通过全面利用多方计算技术,以“可用不可见”的方式,在兼顾科创企业商业机密的同时安全融合其内外部数据,实现科创企业融资轻资化、信用化、便捷化,让其享受到更普惠的金融服务。
对金融机构来讲,从重视固定资产等传统抵押模式转向更注重科创企业的资信状况、创新能力、发展潜力的数据驱动授信新模式,同时有效降低其开展科创金融的风险成本、经营成本,提高金融服务的效率。
最后,在“风险挑战和对策建议”一章,该书亦提到,虽然多方计算、联邦学习等支撑技术在促进金融业数据融合应用方面具有很大潜力。但作为新事物,此类技术的市场接受度有待提升。特别是在强监管的金融行业,仍需各方进一步增进理解、加深认识、增强互信,科学评估风险水平,完善风险管理措施,确保技术在风险可控前提下得到合理应用。
此外,金融业数据融合应用涉及银证保等不同细分行业以及医疗、教育等不同领域的数据,面临兼顾不同行业和领域数据管理差异性的挑战,需进一步推动有关管理部门加强沟通,增强不同领域数据管理规定的协调性,促进数据跨行业跨领域安全合规融合应用。
(王晓雨 )