【猎云网(微信:ilieyun
)北京】4月6日报道(文/苏舒)
智慧城市,已经成为了时代热词,和智慧城市并行而生的,是数据。智慧城市基础设施所产生的数据,被广泛的应用于交通、能源、供水、环境管理、犯罪侦查、教育和医疗等领域。
科技公司DOMO的一份报告中提到,目前每天创建2.5亿亿字节的数据,到2020年,该数字预计将增加到每秒1.7MB,数据快速增长的背后,是智慧城市的兴起。如何利用好数据,保证数据的安全和流通,成为智慧城市下最基础且关键的问题。
“数据安全的强度决定了智慧城市发展的高度。”冲量在线智慧城市产品总经理周岳骞谈到,“数据流通是智慧城市新阶段的核心要素,而隐私计算是数据流通的重要基石。”深耕数据安全领域多年的周岳骞观察到,目前,在数据流通和安全的问题上,隐私计算已经成为了主流解决方案。隐私计算的出现和快速发展恰逢其时,或将为智慧城市的数据安全和隐私保护保驾护航。
数据流通解决方案提供商冲量在线针对智慧城市中的数据流通问题,打造了一整套面向智慧城市的数据流通平台,以及与国产化的硬件软件适配的端到端国产化的隐私计算解决方案,助力企业构建可信、安全、公平、高效的数据流通平台,用数据赋能业务的精细化运营,让企业高速地获取数据价值。目前,冲量在线已经在金融、治安、医疗、通信等领域落地实践。
在上海市2020年的智慧城市经验总结中提到,智慧城市分三个阶段,第一阶段是建设信息高速公路,主要在于建设数据中心,增加城市的网络覆盖率等;第二阶段是单一功能的应用系统建设,主要在于把线下的业务数据化、在线化;第三阶段是应用融合创新阶段,主要在于把数据融合、应用到智能化的创新上。
“数据安全与流通的问题,在智慧城市目前发展阶段显得尤为紧迫”,在周岳骞看来,目前,国内的智慧城市已经逐渐从第二阶段发展至第三阶段,尤其是在十四五规划期间,国家重点强调要“激活数据要素潜能”,因此通过数据的融合共享推动应用创新,成了智慧城市发展新阶段的重要核心。
智慧城市建设带来了大规模的数据集中,包括居民数据、产业数据、公共信息数据等,其中不乏大量的私密数据。在智慧安防、移动支付、电子政务等逐步改善居民生活方式的同时,个人隐私数据、政务和金融机密数据遭遇信息泄露和滥用的风险也随之上升。要想通过数据流通与融合充分推动智慧城市的业务创新,信息保护就成为了需要首要解决的问题。
冲量科技在多个智慧政务和智慧产业项目的实践中发现,智慧城市在信息安全领域所面临的挑战主要体现在以下四个方面:
随着智慧城市大数据中心的建设,大量数据集中到了云平台中,其中就包括众多的隐私数据与机密数据。虽然智慧城市通常都会搭建自己的私有云,但是由于智慧城市中各类应用的复杂性和不可避免的公网访问需求,仍然存在大量的手段可以对云平台发起攻击。因此如何在云平台中为隐私数据的处理提供一个安全、可信的执行环境,是智慧城市中数据流通面临的第一个挑战。
在智慧城市中,许多业务的处理涉及到多个政府机构或企业之间的信息流转,为了实现业务流程的简洁与高效,处理居民或企业请求的平台通常需要向多个数据提供发发起信息查询的请求。在这个交互过程中,查询方所提供的查询关键字、用户三要素信息、查询产生的结果数据等均可能被数据提供方或者平台方所沉淀和保存,从而带来隐私信息泄露的风险。如何保障查询过程对平台方的黑盒性和对数据提供方的混淆性,是智慧城市中数据流通面临的第二个挑战。
数据的汇聚和查询仅仅是智慧城市建设的第一步,进一步对数据进行挖掘和分析才是让数据能够赋能城市“智能化”的重点。而数据的挖掘和分析在许多场景中都无法通过单一机构提供的数据完成,比如联合银行和税务数据进行贷款风险评估、联合公安和交通数据进行城市安全防空等。多方数据联合分析能够充分挖掘出数据的价值,但是也意味着各方需要提供大量的原始数据用于得出最终结果,如何在这个过程中确保原始数据不会泄露,这是智慧城市中数据流通面临的第三个挑战。
智慧城市的建设需要大量的企业和民众作为参与方,多元化的架构为智慧城市提供了丰富的生态,也让各方之间的信任变更更加关键。在数据流通与协作中,如果任意一方提供不完整、被篡改甚至伪造的数据,都会对最终结果产生致命的影响,而数据的处理和使用逻辑如果被随意修改的话,也有可能造成数据的滥用。因此在整体架构中保障数据和算法可度量、可验证、可追溯,保护各方的公平权益,是智慧城市中数据流通面临的第四个挑战。
面对以上的诸多挑战,除了政府方面在积极推动各项数据安全法律规范的落地以外,如何从技术出发去解决这些问题,成了数据安全企业所思考的重点。数据流通与隐私计算领域的服务商也是在这个时间节点,正式走上公众的视野。
隐私计算从技术的角度出发来解决以上问题,成为了业界认可和首选的方式。
隐私计算通过技术手段为数据协作的各方提供一个安全的数据流通平台,确保数据在协作过程中“可用不可见”,即各方只能获取数据计算的结果而无法获取原始数据,并且这种安全特性能够通过技术手段进行论证。
具体来说,隐私计算包含了多种不同的技术路线,其中最主流的分别是基于芯片的可信执行环境(TEE)、基于密码学的安全多方计算(MPC)和源自人工智能技术的联邦机器学习。
可信执行环境是数据计算平台上由软硬件方法构建的一个安全区域,可保证在安全区域内部加载的代码和数据在机密性和完整性方面得到保护。简单来说,可信执行环境构建了一个安全的数据湖,而用户可以通过自己的密道使用到自己所需要的数据,而其他数据则无法获取。可信执行环境具备更好的性能和算法适用性,但是对硬件有一定依赖。
安全多方计算由我国目前唯一图灵奖获得者姚期智院士提出,在没有可信第三方的前提下,各个参与方既不需要暴露自己的原始数据,又可以联合各方的数据来执行特定的运算以达到预期效果。多方安全计算最典型的案例即百万富翁问题,在没有第三方的情况下,两个百万富翁如何不泄露自己的真实财产状况来比较谁更有钱。多方安全计算不依赖硬件且具备较高的安全性,但是仅支持一些相对简单的运算逻辑。
联邦机器学习则是对机器学习技术的拓展,能够在各方原始数据不离开本地的情况下,完成一个多方共同参与的模型训练,从而有效帮助多个机构在满足隐私数据保护的前提下解决模型训练数据不足的问题。联邦机器学习技术通常需要一个协调方,各个数据提供方在本地训练模型的部分参数,然后将得到的参数和梯度信息提交给协调方,再由协调方进行聚合与调整。联邦机器学习技术则可以解决复杂的算法建模问题,但是性能存在一定瓶颈。
总体而言,三种主流的隐私计算技术各有其适用的场景,但同时也有其不可避免的缺陷所在。对此,将三种技术路线巧妙结合起来或能开辟一条相对完善的解决方案。
具体在应用场景而言,结合智慧城市数据流通的痛点与隐私计算的技术特征,不难发现凡是具备数据量大、数据流动频繁、数据隐私性强这三大特征的场景,都可以发挥隐私计算的优势。
举例来说,银行或者金融监管机构对个人消费者的信贷评估,就是隐私计算的一个典型的应用场景。从银行和监管机构的角度来说,对每一个用户做一个精准的信贷评估是非常重要的。一般来说,信贷评估有两个流程,一是模型训练,具体而言就是基于银行已有的历史数据,训练得到一个用户风险评估的模型;二是利用用户风险评估模型,根据申请信贷的新用户的各项数据,对新用户进行风险评估。
在第一阶段,银行除了自身积累的用户历史数据外,还会和其他单位的数据进行合作从而帮助训练得到更加准确的模型,但随着个人隐私信息的重视以及金融信息保护法规的出台,各方面的治理收紧的情况下,用一个第三方的平台接入多方数据,在不接触数据且保证数据安全的情况下,进行模型训练,这时候就需要用到可信执行环境和联邦机器学习的技术。
在第二阶段时,在相对成熟的算法之下对新用户进行信贷评估,需要输入新用户的各项数据作为算法参数,银行和金融机构在不透露查询意图和接触原始数据的基础上,对运营商、政府等多方数据源进行查询使用,就需要用到多方安全计算技术中的不经意传输和匿踪查询等技术。
在一个大场景下打通隐私计算的三项技术路线,冲量在线即是如此,以基于可信执行环境节点的隐私计算网络作为基础,灵活运用多方安全计算和联邦机器学习技术作为补充,同时引入区块链技术让数据协作具备去中心化(抗拜占庭)共识能力和不可篡改的存证能力,从而应对智慧城市中对数据隐私保护的各类复杂需求。
利用隐私计算解决智慧城市中的数据安全和流通问题,在技术层面上,冲量在线坚持选择的以TEE为核心的技术路线具备极强的工程落地能力,最容易结合到智慧城市真实的业务场景中进而发挥业务价值,这也是冲量在线在一众数据流通和安全服务领域的创业公司中逐渐脱颖而出的原因之一,坚持最优的技术路线,深耕技术,逐渐构建起冲量在线的护城河。
当然,在技术上的深耕离不开团队的技术背景。冲量在线注重的是精兵战略,研发团队占比高达90%,且均来自于BAT,具备多年的企业服务项目和云计算相关技术架构的经历。
此外,冲量在线很早便意识到隐私保护不仅仅具备商业价值,同时也关系到民众、社会乃至国家的安全。因此冲量在线坚持推进可信执行环境技术的国产化,在如今芯片被“卡脖子”的背景下,积极适配国产化的芯片平台。冲量在线结合自己的技术优势,从操作系统层面到芯片层面提供了端到端的国产化能力,兼容了包括麒麟、统信、兆芯、飞腾等厂商的国产系统与芯片。“隐私计算这一技术必须要适配到国产的硬件和操作系统之上,才可能做到真正的自主可控。”周岳骞说到。
“对于一个智慧城市的发展来讲,智慧城市是否能够通过数据价值的挖掘,从数据中真正获得‘智能’,一个重要的前提就是数据在安全的环境下顺畅流通。在这个过程中,隐私计算起到的作用就是增加数据安全的强度,从而帮助智慧城市走的更长更远。”
智慧城市还在不断向前发展,而隐私计算也逐渐被认识且广泛应用落地。在智慧城市的历史长河中,冲量在线就像是河堤的建设和维护者,用自身技术为智慧城市保驾护航。