数字化的概念已经提出多年,但对于不少传统行业,企业的数字化仍处于初始阶段。公司内部存储海量数据却难以发挥效用,即便建立了多种数据架构也都停留于烟囱式的数据管道,但管道之间却少有打通。对不少企业而言,数据不仅不是资产,甚至是负资产。如何让数据变得真实可用是摆在不少传统企业面前的难题,而对于另一批新兴的科技企业却是良好的机遇。
从金融行业切入,破局数据困境
阿博茨科技于2017年正式开展业务(以下简称“阿博茨”),按联合创始人余宙的解释,阿博茨代表着“ABC”,即“Al、Big Data、Cloud”,也就是人工智能、大数据和云服务,是一家Al赋能传统企业的科技公司。
面对庞大的传统行业,阿博茨将目光率先锁定在了金融行业。余宙解释,传统金融业常年与数据打交道,因此行业的数据完整性更高,但另一方面这些数据的使用却是难题,抠数据、找数据、填数据、画图表等粗活累活充斥着金融从业者的日常。“我们之前做金融业的调研,我们称自己是‘码农’,他们说自己是‘金融民工’,是‘表哥’‘表妹’。” 余宙说到。
人工处理数据不仅难以提高数据的处理效率,也使得真正有价值的数据难以被发现,“就像货物被散放在仓库里难以寻找一样,想从海量数据库里找到有用的信息非常难。”余宙说到,“所以金融行业经常说自己坐在金矿上却找不到金子。”
面对金融行业的痛点,余宙认为存在两种解决方案。一种是培训人工智能的分析师,另一种则是为人类分析师提供分析工具,让AI代替分析师做一些重复性机械化工作。余宙认为,AI分析师难以适应不同的环境,比如一个投资策略会存在市场容量,超过这个容量策略可能就无效了,因此阿博茨放弃了“雇佣兵”的培养,致力于“军火商”的打造,将AI训练成一个超级分析师助理辅助人类分析师完成工作。
基于自然语义处理技术,简化人工操作
阿博茨提出的解决方案是把自然语言处理、机器视觉技术以及机器学习、深度学习技术,运用在日常的数据处理工作中,从而建立一个庞大的“数据工厂”。从收集、汇总、抽取、建模、应用到最后可视化,覆盖数据的全生命周期。数据工厂的概念强调“不能脱离业务,不能脱离技术,更不能脱离人。” 首先是技术核心,只有拥有了一个高效的数据流水线,才能够覆盖从数据获取、传送、加工到使用的各个环节,但是更重要的是不能离开人。余宙进一步解释道:“数据工厂的本质是以机器为主,人工为辅,也就是技术为核心,业务做辅助。”他以财务场景为例,如果两家企业想要分析出他们在过去10年的营业收入和净利润对比趋势,就得从他们两家公司过去10年每个季度的财报把相关数据摘出来汇总到一个表里,通过分析做成图表,最后撰写出数据分析报告。
这一流程能够通过数据工厂得以高效实现,直接获取分析成果,这其中就经历了整个生命周期的全流程,这一条数据生产线也正是阿博茨可以提供给客户的最核心价值所在。对于企业而言,这些庞大的数据用起来既费时又费力,但是其实数据更像是“金矿”,阿博茨科技将数据信息进行挖掘和提炼,能够产生非常大的价值。就像坐在金矿上挖金子一样,不仅可以自己加工生产数据,还可以对外提供服务,利用数据工厂去赋能企业,帮助企业把原有内部数据利用起来。
基于AI对自然语义的理解,人类分析师便可以将高重复性工作交给AI完成,从而达到降本增效的功用,此外还能够打通客户的诸多数据系统,实现数据间的联动。
具体来说AI在场景中的运用可分为三层,首先是需要将海量非结构化数据传入到系统中变成结构化数据让机器不断学习,比如新闻、公告、研报、图片等等,在这一过程中数据员需要对AI作标注训练,AI可以在训练过程中不断得到成长,最终能够帮助员工找到所需数据。
第二层则是识别数据语义,机器能认出数据不代表知道数据的语义,因此需要自然语言处理的技术来帮助机器明白每一类数据在文本中的意思,余宙举例说道:“我想要知道到桂林旅游的营业收入是多少,如果机器不知道桂林旅游公司它就无法判断出这句话是要让它去查公司财报还是订票去旅游.”
最后便是用可视化技术将机器解读出的信息再反馈给人类分析师,这样数据便经历了一个从非结构化数据到结构化数据再到非结构数据的转化过程。传统上分析师只能在海量数据库中寻找数据,但在阿博茨AI系统的帮助下,只需要在搜索引擎中输入关键词便能找到想要的数据。
谈及技术难点,余宙坦言,在人工智能领域中,较为困难的就是自然语义识别,自然语言文本是典型的非结构化数据,由语言符号(如汉字)序列构成,是人类使用的最庞杂的符号系统。语义往往还具有语境特征,比如你问Siri一些简单的问题它可以回答,但更专业的问题它就不知道了。因此对阿博茨而言,做通用性的技术并非最佳选择,深耕垂直领域才是关键。
经过3年多的沉淀,阿博茨目前的可视化引擎经过反复的文本训练,已经学习并储存了超过3千万份金融的文档和报告,阅读了超过10亿张的金融图片和信息,几乎已经涵盖了金融数据的所有类型。据透露,目前阿博茨在金融领域的语义理解达到行业的领先水平,对上市公司各类公告的关键要素的信息抽取能达到95%以上的准确率。
立足财务场景,延伸多个行业
目前阿博茨已经服务于香港交易所、中国投资有限责任公司、中国人保等超过100家企业,大资管领域的券商、基金、资管,泛金融领域的银行、保险、交易所,以及大数据领域的酒店集团、地产、电力、垂直电商都是阿博茨的服务客户。在拓展客户行业同时,余宙也强调,财务类场景仍然是核心立足点,因为语义识别具有场景特征,熟悉了财务场景的系统在财务领域更具优势。
余宙认为,对客户而言阿博茨的能力不仅仅是降本增效,更重要的是通过增速提高了客户应对市场的反应速度。“像金融这种瞬息万变的行业,提高操作速度能够让客户更快地部署决策。”余宙举例说到,以前一家客户需要260人在3-5天完成的工作在阿博茨系统的帮助只需要20人两小时就能完成。
在交付能力上,余宙透露,不同的客户会有针对性的需求,因此交付周期也因用户而不同,但通用的部分只需2-3周就能完成。同时为了使用户习惯系统操作,在定制系统时往往需要模拟用户原有的操作场景以便用户可以尽快上手。
在商业模式上,阿博茨目前采用的是软件授权+按量收费的模式,比如保险公司用系统完成了多少单,按成单量来收费。但同时余宙也透露,未来更多的会发展按量收费,以保证长期发展。在复购率上,余宙透露目前还没有出现过客户丢失的情况。而在获客来源上,作为服务B端的企业,阿博茨主要通过业内转介绍介绍来吸引客户,同时广泛参加传统企业的相关培训或会议,以此来建立行业认知度。
作为一家AI科技公司,阿博茨的发展离不开技术的支持。目前公司内部有200多人,其中70%左右都是技术人员,且大多数都来自微软系列。创始人杨永智是前海豚浏览器创始人,余宙作为他的搭档和他已经合作了15年左右,阿博茨的成立也是两人联手的二次创业。此外,阿博茨还曾获得2020达沃斯世界经济论坛技术先锋、2019全球十佳RPA+AI创新企业等几十个奖项。目前,阿博茨已经获得天使轮、A轮、B轮合计5亿元的融资,投资方包括源码资本、启明创投、SIG海纳亚洲等知名投资基金。
本文文章头图来源于摄图网,插图来源于阿博茨,经授权使用。本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。