2021年11月25日,北京数牍科技有限公司(以下简称「数牍科技」)宣布完成3.08亿元人民币Pre-A及A轮融资,本轮融资由GGV纪源资本、上海人工智能产业基金、深创投联合领投,老股东红杉中国跟投,恒生曦域产业基金、理工创动、华盖资本、将门创投等机构跟投,INP麟华殷资本担任本次独家财务顾问。Pre-A轮融资由招商局创投领投,红杉中国和红点中国跟投。天使轮由红杉中国种子基金投资。本轮资金将用于公司隐私计算底层核心平台的持续研发以及更丰富数据协作场景的产品化落地。
数牍科技成立于2019年初,在国内较早以系统性隐私工程视角和基于协作场景的产品来落地隐私计算,并与合作伙伴共同推进隐私计算的多个首次突破。成立的两年时间内,数牍与三大运营商、银联、工商银行、北京银行等多家国央企、金融机构、头部互联网公司及其对应各行业的数据协作生态企业达成合作,覆盖金融、营销、风控、医疗等场景,积累了近百个数据协作产品和模型。2020年上半年,数牍科技在行业内率先落地运营商场景,并成为联通数科(原联通大数据)唯一一家隐私计算平台技术提供商,与联通共同完成行业首个TB级隐私计算商用项目落地,目前仍在持续支撑联通数科亿万级数据量在生产环境中的流通与协作。2021年,数牍参与了深圳数据交易所关键技术预研,与深圳数据交易所共同探索数据要素市场建设,并提供数据流通环节中的隐私计算技术平台支撑。同时,数牍还成为上海数据交易所首批签约数商,北京国际大数据交易所联盟首批成员单位。
数牍科技积极参与公安部、工信部、国家金融科技测评中心等国家部委和权威机构的多项认证,成为行业首批通过信通院金融场景隐私保护计算平台测评的公司,并积极参与推动隐私计算技术的行业标准设定和技术落地——与中国信息通信研究院、中国电子技术标准化研究院、北京大数据中心、中国电子工业标准化技术协会信息技术应用创新工作委员会等多家机构合作并编写行业白皮书。
数牍科技创始人宋一民毕业后在Juniper担任安全工程师;之后加入微软Azure,成为存储和计算早期团队成员,参与了Azure Cloud从零到一的搭建过程;在微软积累了五年多云计算经验后,宋一民加入Facebook ads,主导了Facebook收购instagram后的数据打通等大型数据工程项目,并在内部发起Facebook和多个世界五百强公司基于多方安全计算的数据协作项目。云计算、数据工程和隐私、安全十多年的经历,让其对隐私计算深厚的技术栈有更深刻的理解和全局视野。联合创始人蔡超超博士毕业于UCLA,是机器学习和联邦学习领域专家,曾获得Facebook Distinguished Equity(杰出贡献奖)。
数牍的工程团队覆盖密码学、联邦学习、分布式计算、云原生、数据科学和数据工程、安全等领域,来自华为、字节跳动、Facebook、Google、Amazon、Microsoft等国内外顶尖的科技企业。有Google Cloud BigQuery的大数据系统架构师,有曾在Facebook 隐私基础构架组(Privacy Infrastructure)从零到一参与隐私工程系统性搭建的数学和密码学科班工程师,有Compass等云原生前沿企业的基础架构负责人,有华为硬件安全资深专家等,并有多名ACM获奖者。产品和销售团队由来自金融、营销、风控、医疗等行业头部企业的一线专家组成,行业积累和场景理解深厚。从最初的宋一民、蔡超超两个人到目前的一百多人团队,“我们有超过二十多个工程师都是放弃硅谷高薪带着家人回到祖国,我们希望将隐私工程技术栈各个关键模块的人才引回祖国,并与国内的技术和行业专家共同打造国产自主研发的、具有核心知识产权的隐私工程平台”。
相较于作为协作关键环节的“隐私计算”,“隐私工程”更能表达数牍团队对数据流通全生命周期的愿景与理解。隐私工程是一套从底层计算及网络资源到最上层数据产品及应用的工程体系、贯穿对数据流通全生命周期的理解,要在严格的隐私保护和数据安全基础上,做好系统效率、网络成本、用户体验的平衡;也需要细节详尽的工程技巧,包括敏感数据检测、匿名技术、数据追踪等技术运用,甚至要具体到诸如用户标签分类在隐私保护和准确度间的权衡问题。
隐私工程的思想也体现在数牍科技全自主研发的隐私计算平台Tusita上:1)在“计算分布式,流通可监管”的架构设计中,原始数据及模型在本地进行分布式处理,监控节点能实现开放透明的流通可视;2)将性能优化做到极致,实现工业级部署和落地。目前 Tusita在十亿级数据量协作场景和高并发、高实时性环境中,能够进行毫秒级响应,满足多种复杂场景的业务需求; 3) 开箱即用的产品体验和可插拔的兼容性。可视化、针对不同的应用场景丰富的产品和模型支持,让用户上手即用、将使用门槛降到最低。同时平台充分考虑了各类数据基础设施和治理产品工具的对接,降低不同类型数据的接入成本;4)贯穿数据全生命周期的工具链支持。从数据安全和隐私治理到下游协作计算,数牍研发了多个易用且解决痛点的工具、贯穿数据流通全链路,未来也会进一步开放给生态用户。
隐私工程扎实落地场景的同时,数牍前沿研究团队也实现了计算机体系架构层面的硬件突破。不同于现有的TEE或硬件加速方案,这是一套通信和体系架构层面的创新,在大幅度提高计算性能的同时,能进一步解决数据投毒、计算不可信等问题。
数牍从成立初期就开始搭建行业专家组成的产品与场景团队,探索数据协作场景并进一步抽象为数据产品和模型。在宋一民看来,通过基于协作场景的数据产品或模型才能让隐私计算真的被用起来发挥作用,但不是把传统的数据产品用隐私计算技术重新做一遍,其更大场景在于增量协作场景的价值创造。数牍产品和场景团队两年间探索了数百个协作场景,抽象了数十个通用产品和近百个模型,包括风控反洗钱、销售线索去重和线索评级等产品,已落地多家头部车企、头部金融机构、互联网公司和新经济企业。其中不少产品还是行业基建类型的首创。
比如由数牍参与研发和运营,中国信通院、电信运营商和中国商务广告协会共同推出的数字营销行业基建产品“ONEID”。ONEID是依托中国信通院的数据安全体系、基于运营商认证能力生成的匿名广告标识,可以在充分保障隐私信息匿名化、不可逆推的属性基础上,识别不同平台和媒体的设备真实性,赋能广告业务。
两年来,数牍与三大运营商、中国银联、中国工商银行、北京银行等行业头部企业都展开了深度合作,协作其与上千家生态企业通过隐私计算进行数据协作。数牍的第一步是通过安全高性的隐私计算基础设施和可落地的数据协作产品,帮助头部企业及其数据生态建立连接和协作,并打磨隐私隐私计算平台Tusita的易用性、稳定性和工具链生态。未来随着数据要素市场的进一步成熟,将进一步开放平台隐私工程能力和工具链降低协作门槛,促进中小数字化企业间的协作,让数据不再成为AI的制约瓶颈。
GGV纪源资本管理合伙人李宏玮表示:“数据已经成为各行各业的核心资产和价值,但同时对数据隐私的保护越来越严格。数据作为一种特殊的资源,需要流动起来才能产生价值。不过这种流动不是数据本身的共享,而是数据价值的流动。因此隐私计算有机会成为数据流通的基础设施,实现数据的,‘可用不可见’,既能充分挖掘数据共享的价值,也能保护隐私与安全。GGV认识数牍两年来,看到了管理团队快速的成长和进步,把海外经验和前沿技术落地到本土场景中。我们看好数牍带领隐私计算行业发展。”
从天使轮、Pre-A到今天一路支持的红杉中国合伙人周逵表示:“红杉从2019年就关注到隐私计算的趋势并提前进行布局。数据逐渐成为数字企业核心资产,隐私计算是实现数据所有权和使用权分离的有效技术方式,帮助企业间更好地进行数据流通协作、推进数据要素市场建设。数牍管理团队全栈的工程能力和对数据场景的深刻思考打动了我们进行早期投资。从最早入驻我们中关村孵化器的5个人到现在100多人,陪伴数牍两年多以来,我们看到了团队的快速成长和一批优秀客户的认同,希望数牍团队继续砥砺前行。“
上海人工智能产业基金总经理吴巍表示:随着国内外数据治理的法律法规不断出台,数据隐私保护监管日趋完善。隐私计算技术有助于塑造数据安全环境,打破数据孤岛,在数据资源层推动数据高效协作,是人工智能重要的数字底层技术。数牍科技团队既有丰富的密码学、分布式计算、联邦学习相关的人才及技术储备,又在工程化落地及商业化方面处于领先位置。我们相信数牍团队能够持续创新,不断探索,助力政企搭建安全高效的人工智能数据安全协作平台,在日益增多的落地场景释放数据价值。上海人工智能产业基金将持续关注支持数牍科技赋能数字化转型。
深创投副总裁、党委委员、董事会秘书李守宇表示:随着数字化进程的加速,数据已成为一种新的生产要素,而数据安全必然成为产业发展的重中之重。数牍科技的创始团队成员均来自国内外知名企业,在多方安全计算、AI、大数据等前沿数字化技术的研发和应用方面有丰富的经验。公司的工业级落地能力、对应用场景的理解以及对客户业务生态的支撑能力已得到多家大型机构客户的认可,推出的隐私计算产品目前已在金融、电信、消费、政务等多个领域有成功落地案例。未来,我们相信数牍能与更多的合作伙伴共同打造安全合规、健康可持续的数据协作生态,在促进数据基础设施建设中贡献力量。
Pre-A轮领投方招商局创投总经理吕克俭表示:在数字经济蓬勃发展的国内形势下,数据要素必须要在可信、安全、有序的前提下开放共享。数牍团队曾处于全球隐私工程落地的最前端,最早去接受这项技术在实际场景中的落地考验,成立两年时间里,已经沿着自主研发、国产可控的道路,交出了很不错的成绩,我们看到数牍的平台产品已在政务、金融、互联网等多领域进行落地,并且有着非常好的用户口碑。我们非常看好数牍科技,相信他们能够凭借着自身扎实的工程水平和丰富的商业化经验,与行业伙伴一起筑牢数据安全流通基础设施的关键一环,共同维护好数字经济发展环境。