【猎云网(微信:ilieyun
)北京】8月9日报道(文/盛佳莹)
近日,大数据产品及解决方案供应商睿帆科技宣布完成5000万A轮融资。本轮融资由东方通领投,沣扬资本等跟投。本轮融资将加大在海量计算与存储能力、数据中台、数据集成、数据治理、数据分析等领域技术和产品的研发投入。
谈及此次投资逻辑,东方通表示:“睿帆科技是国内少有的拥有PB级别数据处理核心技术的大数据公司,其所处的大数据领域及产品方向,契合东方通“数据+”战略,可为公司战略落地进行更广阔范围的赋能。”
这是睿帆科技成立以来第三轮融资,此前,睿帆科技曾获佳都科技1615万天使轮融资及花城创投数千万pre-A轮融资。
佳都科技和此轮领投方东方通均为大数据产业企业,可见产业资本对其业务发展的信心。
事实上,当下中国的社会经济已全面进入数字生产力快速发展新阶段,数据要素凭借边际成本低、规模效应大、流动性高、可复用性强等区别于传统生产要素的新特点,正在成为引领中国发展的一个新引擎。
根据中国信息通信研究院对大数据相关企业的调研数据,2016-2019年,我国大数据产业市场规模由2841亿元增长到5386亿元,增速连续四年保持在20%以上。根据近年来大数据行业市场规模增长态势,2020年大数据行业规模约为6670亿元。
睿帆科技董事长&CEO徐峰也表示,大数据是一个不断发展,持续投入的长周期赛道。
如今,企业拥有PB级数据已经成为常态,EB级数据时代也将很快到来,面对复杂、多元的海量数据,如何高效处理数据已成为当前数据领域最重要的挑战。
为了帮助企业高效处理海量数据,睿帆科技通过三大产品群搭建了一套大数据中台体系。
其中,大数据科学平台Baymax围绕多源异构的海量数据入、存、管、出四个核心场景,集数据集成、数据治理、数据分析、数据监控及系统配置等功能为一体,可以有效支撑企业数据治理过程中的各个环节需求,为企业级大数据应用提供端到端,全生命周期的数据解决方案,帮助企业对海量数据进行采集、存储、治理、分析和挖掘,发现数据价值。
同时,为了降低企业运用大数据的门槛和处理数据的工作难度,Baymax采用低代码的可视化开发模式,通过拖拽式进行人机交互。
在性能上,Baymax可以支持3000个支点,达到每天一个PB的数据处理能力,并支持海量平滑拓展。
但很快睿帆科技团队发现,面对庞大的数据量,很多企业早期主要通过抽样数据来获取结论。抽样之后的数据变成百万级或千万级,是原始数据的一个子集,和实际情况会有很大的偏差,导致根据样本得出的结论可靠性大大降低。
为了追求数据的准确性,有的企业不得不降低数据处理的实时性,采用离线处理的方式,但是数据的价值就在于其时效性,越早分析越能得到快速准确的反馈和响应,并及时利用结论指导后续的业务工作。
如何针对海量数据进行实时即席查询分析在这时显得尤为关键。
为此,徐峰带领睿帆科技自研了一款分布式分析型数据库雪球DB。
雪球DB是一款纯列式数据库,提供海量结构化数据存储和高并发查询。针对此前采用离线手段提高数据的准确性,却失去了时效性的痛点,雪球DB则提供PB级数据联机分析处理,实现高吞吐即席查询(Ad-hoc)和多维分析场景。
多master集群结构,打破了传统架构的读写瓶颈,支持高并发同时读写。同时,雪球DB支持超大数据量,可以实现千亿数据条级别。
除此之外,睿帆科技还研发了一款大禹中文智慧文本平台,打破文本信息孤岛,通过少量语句训练即可完成文本处理、存储、识别、关联、分析、交互查询的综合性文本处理。
这套组合拳形成了覆盖结构化、非结构化、半结构化数据的一整套系统,实现在互联网场景下的一体联动。
早在1980年,未来学家托夫勒在其所著的《第三次浪潮》中就将“大数据”称颂为“第三次浪潮的华彩乐章”。
如今随着大数据赋能消费、金融、医疗、教育等多个产业,毫无疑问,大数据主导的数字经济正在成为当今最活跃的经济形态,也是如今全球经济增长的重要动力。
今年“两会”期间,“加快数字化发展,打造数字经济新优势,协同推进数字产业化和产业数字化转型”也被写进国务院2021年政府工作报告,数字化作为新时期中国社会经济高质量发展的基建,已经成为我国企业在后疫情时代弯道超车的势能底座。
与此同时,不少传统行业在大数据时代下正暴露出越来越多的问题。
以电信行业为例,徐峰告诉猎云网,随着4G技术的普及和5G技术的应用,数据近一步呈现爆炸式增长,单日数据增量可以达到PB级别,需要管理调度上千个节点。同时,通信网络主网结构复杂,数据多源异构,应用场景多样,“过去网信故障判断依赖人工经验分析,但在现在的复杂情况下,人工定界定位容易出现误判、漏判。”
“没有大数据运维能力很难保证并发处理和多任务资源调度。”为此,睿帆科技以PB级数据处理技术为核心,将多源数据融合贯通,提供前置采集,解决网络无法直接连通数据的跨网摆渡传输。同时,引导式数据导入配置,提供全量、增量模式和多种加密脱敏策略,满足个性化数据集成场景。
除此之外,睿帆科技通过自研的大数据中间件技术,使上层平台应用与下层技术组件保持松耦合,通过集成框架可以灵活进行各类存储引擎、计算引擎和Al引擎的服务调度、路由策略和线程封装,快速响应上层业务需求,灵活扩展编排的同时保持平台整体稳定和管理统一。
据了解,目前睿帆科技的运营商大数据共享中心,集群已超过1500个节点,日增量数据超过1PB。
“电信行业经历过IT系统时代,总体上IT化程度高,便于数字化转型,但像地铁这样过去追求稳定可靠的技术保守型行业,如今也在积极寻求数字化转型。”在徐峰看来,如今的地铁行业正处在大的转型期。
“地铁普遍系统分散建设,系统间通信接口繁杂,各自定义,格式不统一,数据孤岛严重。加上应用场景复杂,如何打通全链路数据,支撑全业务流程协同是一个挑战。“
睿帆科技针对地铁细分行业,构建了城市轨道交通数据中台体系,将各种设备、业务系统等产生的数据,建立统一数据规范和管理体系,打通数据孤岛,实现数据集中化管理。
同时,以提供数据服务为最终成果,区分高价值数据和低价值数据,通过提取共性需求,对数据服务进行最小化解耦,实现数据服务的快速复用。实现了自动化监控和预警,设备生命周期分析预测,客流分析预测,高峰期智能调度,能耗动态优化等多个智慧化应用,帮助地铁走向智慧化运营。
针对不同行业场景,睿帆科技通过“睿擎行业大脑”,将通用的核心技术作为底层,行业业务逻辑组件化,通过插件部署在底层之上,以此,增强企业粘性,提升企业服务,助力企业在大数据时代的数字化转型。
从北京邮电大学硕士毕业后,徐峰先后就职于东软股份、Nokia、佳都科技等企业,从技术研发、系统架构师、项目经理,徐峰将大数据各个岗位几乎都做了一遍。
2014年,4G在中国开始商用,二十多年的大数据技术研发与应用经验让徐峰意识到,4G时代的到来将会带来大数据技术及应用的腾飞。
在数据爆发情况下,一定会产生大数据需求。如今回过头来看,徐峰的判断无疑是正确的。
电信运营商过去传统的Oracle架构已经处理不了4G带来的暴增的数据规模,徐峰回忆:“当时,处理需求的规模已经达到一天30个TB。”睿帆科技踩住了风口。
而如今,随着5G技术的发展与应用,徐峰判断网络侧数据采集相比4G时代至少有4倍提升,数据一定会再次迎来爆发式增长。
面临新的技术升级,徐峰也做好了准备。“Baymax本身就是侧重海量数据处理能力,面对5G,Baymax将继续做深,同时还将加强实时性处理能力。”
在徐峰看来,大数据是一个不断发展,持续投入的长周期赛道,“最初,在上百条数据的时候我们用excel处理,当数据增长到上亿条、万亿条时,会出现新的工具,只要技术不断革新,大数据就会永久往前发展,这也是大数据这个赛道的魅力之处。”
而徐峰希望睿帆科技可以成为这个长周期赛道中的新生军,用技术给企业带来价值。
但徐峰也坦言,从技术角度一家公司很难做到全栈式。因此,睿帆科技通过联合上下游,构建互补的生态链,为企业客户找到合适的合作伙伴,共同创造价值。