近年来,人工智能在全球获得长足发展。作为其核心驱动力之一,知识图谱技术自谷歌2012年推出首版构建并应用于实际系统的“常识知识图谱”以来,始终热度不减。
这一技术在生活中最常见的应用,莫过于我们使用搜索引擎时系统显示的联想词——联想词主要是系统前端根据用户输入的信息,匹配后端知识图谱里的字符串,再返回的一个按关联性排序的、包含结果的数组,最终的呈现效果就是一个或多个与输入内容相关的词条。
比如我们在百度输入“国庆”,系统就会联想出“国庆节日历”“国庆调休安排”等词条。甚至我们手机中经常收到的头条快讯、娱乐新闻、商品广告等各种推送也都有知识图谱的参与。
知识图谱将存在于客观世界的知识表达成机器能够处理和理解的形式,让机器具备认知能力,进而为人类提供更加广泛的智能化服务,现已广泛应用于金融、医疗、情报、军工等领域,且华为、联想、百度等国内知名企业已在全行业应用上占据相当大的市场份额。
创业邦近期接触的企业——南京柯基数据科技有限公司(以下简称:柯基数据)是一家知识图谱认知智能方向的领军企业。
公司基于一站式企业级自动化知识发现平台,从细分行业着手做针对性开发,致力于将企业复杂的数据及知识工作自动化,产品全流程低代码,便于企业使用,帮助企业业务决策更加智能化。
柯基数据创始人兼CEO吴刚曾任职智能数据公司「汤森路透」首席顾问,深入医药、科技及金融情报的数据产品、售前解决方案及咨询业务,并参与汤森路透全球知识图谱项目,行业资源及经验丰富。
他表示:“以传统情报分析为例,其大部分数据源自舆情,数据处理的颗粒度相对较粗,比如只提取出正负面信息或实体信息,并没有深入其中把这个公司、人或产品等各种信息关联起来构建一个结构化知识图谱,分析程度相对比较粗浅。柯基数据重点开发认知智能能力,用一套相对比较复杂的技术实现知识图谱的半自动化搭建及运维,与行业需求紧密结合,这不同于传统大厂主要靠算法不断完善感知智能的方案。”
目前,柯基数据技术已覆盖从数据采集到数据清洗、知识提取、知识表示、动态本体建模、图存储、知识推理、可视化关联分析、智能问答、语义检索等知识图谱全技术链。
在具体服务上,柯基数据分为四类:第一是知识图谱PaaS平台,帮助企业集成自身内外部数据搭建知识图谱并运维,构建企业自己的知识中台;
第二,柯基数据面向市场推出DaaS产品,基于行业公开数据及专家经验的整理构建行业级的知识图谱数据,以及百科公开数据构建的百科基础图谱;
第三,搭建SaaS工具及应用,包括智能语义检索、智能对话、智能问答、智能推荐系统等;
第四,基于PaaS+DaaS+SaaS的一站式企业级解决方案。
以柯基数据为某医药大健康企业开发的“医学知识图谱智能问答SaaS产品”为例:该产品基于行业知识图谱认知智能引擎技术,通过企业FAQ咨询数据、药品说明书、病历、医学指南、医学书籍、医学论文、专业网站、专家录入数据、可穿戴设备采集的用户数据等数据源,构建出“疾病-症状-药品-诊断-护理-食谱-食材-营养素-人群-饮食禁忌-营养保健产品”知识图谱及基于图谱的医药大健康智能专家虚拟助理。
该产品为药企、医疗科研机构、医院及营养健康领域的企业,提供从药企学术营销、健康管理和疾病用药专业知识咨询、导诊和辅助诊断、慢病护理、智能推荐的医药大健康全周期知识服务。
那客户为何会选择柯基数据呢?吴刚向创业邦介绍:“柯基数据在产品化程度、智能化体验、自动化运维能力和行业知识积累上具备优势。”
首先,柯基数据当前三款知识图谱产品均已有落地案例,产品化和智能化程度高,用户体验优秀,产品之间均已打通形成全栈的自动化知识发现产品矩阵。
知识图谱的最重要特点便是可解释性和发现新知识的能力,让“推理”转入黑盒模型预测范式,把领域知识或常识结构化并在此基础上进行推理,类似于人脑的功能,这是目前的深度学习方法很难做到的。
比如评审专家的查找推荐,如果使用深度学习的方法进行训练,整个查找过程类似于黑盒操作,无法追溯推荐理由,但使用知识图谱建立高精度专家画像及专家关系网络,能够为专家推荐提供可解释性,比如是根据评审专家的学科领域、学术论文发表情况等,并持续更新。
其次,自动化运维能力是影响产品生命力的重要因素。在企业端,很多时候是由非技术人员来运维,他们更多关注怎样能简单高效方便地进行运维,尽量减少人工的运维工作,例如知识图谱的自动更新、语料词库的增加、未知知识的自动识别、模型训练等功能,这就要求产品具备较高的自动化运维程度。
柯基数据基于多年行业案例积累做了充分的优化,全流程低代码,丰富产品前端功能、降低使用门槛。医药知识图谱智能问答系统,可在较短时间内完成模型训练和系统对接开发并上线,运维也可由具备一定医学背景的人员完成,大大降低了运维的成本和迭代的速度。
最后在行业知识的积累上,柯基数据现已在医药、军工、金融等领域有多年的经验和行业数据积累,在项目涉及从多源异构数据进行建模、抽取数据、融合构建图谱、基于知识图谱的智能问答训练时,能快速冷启动,不必从0开始。
同时柯基数据作为开放知识图谱联盟Open KG发起单位,曾获工信部 IEEE 国际知识图谱标准制定单位认定,其知识图谱平台及智能问答产品也获得工信部标准院的权威测试认证。公司拥有30余项软件著作权、8项发明专利。
在商业规划上,柯基数据短期内以大客户整体解决方案为主,中期目标推广PaaS产品,并长期服务好行业图谱数据生态。
其中,行业大客户解决方案是基于PaaS、DaaS及SaaS组件为客户定制化整体解决方案,支持私有云部署,收取“平台产品+数据+定制化”综合费用,客单价可达千万;PaaS平台产品是直接售卖或者通过系统集成商渠道集成平台产品进行售卖,客单价在百万级。以上两种模式均后续收取每年系统及场景拓展费、数据升级及运维费(包年)。而行业图谱数据生态产品即DaaS图谱数据及基于开源数据的SaaS产品,可开放API接口,按照使用次数收费或按账号收取年费。
当前柯基数据客户总量50余家,涉及医药大健康、军工政企、智慧城市、科技情报、金融等领域,包含吉利德、西安杨森、赛诺菲、勃林格等知名医药企业和中电科集团等军工企业、军工科研院所。
目前公司主要营收来自军工跟医药行业,2020年已盈利并实现正向现金流,未来公司仍将在这两个行业深入拓展,同时发展以上其他行业大客户。
团队方面,柯基数据现有员工60人左右,研发人员占80%左右。公司聘请开放知识图谱联盟Open KG创始人、东南大学认知智能研究所所长漆桂林教授担任首席科学家,技术优势显著。接下来公司将不断完善整体团队架构,加大力度拓展研发团队和项目成功团队,并引进拥有医药、军工行业背景的人才。
截至目前,柯基数据已完成A轮融资,累计获得来自动平衡资本、创客邦投资、常呈益基金的数千万元融资,并预计2022年将开启下一轮融资,将主要用于产品研发、人才招募和市场拓展。