改道港股IPO,大模型成为云知声的新故事。
创业邦(ID:ichuangyebang)原创
作者丨巴里
编辑丨信陵
图源丨云知声、图虫网
时隔2年多,这只估值达87亿元的AI独角兽再度冲击IPO。
日前,国内AI语音“独角兽”云知声智能科技股份有限公司(以下简称“云知声”)向港交所递交招股书,拟在香港主板IPO上市。早在2020年11月,云知声就向上交所科创板递交过上市申请,但仅隔3个月便撤回上市申请。
成立于2012年的云知声,最早以语音识别切入市场,目前则主要提供人工智能产品和解决方案,涵盖智慧生活和智慧医疗中广泛的AI应用场景。
创业维艰,创始人&CEO黄伟曾在创业早期刷光个人信用卡,写下人生第一张200万欠条;他也曾在2015年力排众议投入AI芯片,在看到2021年的芯片热时反而保持冷静;他更在2016年的时候每天坚持出现在北京协和医院的晨会上,在投资人和内部团队的反对声中坚定看好AI语音医疗场景的终局,哪怕在2018年融资时医疗板块的估值为零。
到如今,云知声已拥有超过2万家行业客户与开发者,其中包括华为、美的、格力、长虹、京东、北京协和医院、平安集团、吉利汽车等多家公司和机构。
值得注意的是,云知声在5月推出了一个号称拥有600亿个参数的自有大语言模型山海大模型,并放言年内通用能力可比肩ChatGPT。那么,如若此次上市成功,黄伟能否带领云知声乘着风口破除AI商业化落地的难题呢?
为了创业写下人生第一张欠条200万
能够愿意All in自己的积蓄在创业这件成功率极低的事上,这样的创始人可以说如凤毛麟角。
1976年,黄伟出生于河南信阳。与创办科大讯飞的刘庆峰一样,黄伟也毕业于中国科学技术大学,二人差了三届,是刘庆峰的师弟。不过当刘庆峰1999年创办科大讯飞时,黄伟还未毕业,不会想到在智能语音赛道上,黄伟、梁家恩两位学弟创办的云知声会成为科大讯飞此后最重要的对手之一。
2004年黄伟加入摩托罗拉中国研究中心(MCRC)担任资深研究员。在金融危机期间,摩托罗拉将整个语音识别团队出售给Nuance。黄伟拒绝被Nuance收编,于2009年7月加入盛大网络旗下的创新院,并于2010年10月创建了语音分院。
盛大语音团队在黄伟的带领下曾迎来高光时刻。在美国国家标准技术署(NIST)举办的声纹识别评测(SRE)大赛中,盛大语音团队力压麻省理工、斯坦福研究中心、IBM等众多名校、名企,在9个单项任务中获得5个单项第一,整体综合指标第一。
黄伟的师弟梁家恩,也是云知声另一位创始人,在2011年加入到盛大语音分院,担任高级研究员。随着2012年盛大创新院的战略调整,语音团队从创新院剥离到盛大掌门科技。他与黄伟选择了一起创业。
彼时,iPhone4s搭载Siri语音助手刚刚在2011年推向市场,引发了全球智能语音的创业浪潮。黄伟看到了将智能语音作为重要切入口,人机交互的未来机会。
2012年7月,云知声正式成立了。
创业之初,为了支撑公司早期的发展,黄伟在把自己家底掏光之后借了200万元,写下了人生的第一张欠条。“我买房子贷款都没贷过这么多钱。但你追求的结果是这辈子绝大多数人都实现不了的一个梦想,当然要为这个梦想付出代价。”黄伟说。
如果时间拨回到2018年,会看到黄伟写的PPT上有着这样一句话:世界上最难走的路才是捷径。“对创业者来讲,容易走的路多半都是死路。”
作为创业者,需要对行业发展的前瞻性做判断,这也是一个创业者最基本的能力。黄伟把它总结为,“战略走在技术前,技术走在业务前,业务走在客户前。”
在黄伟看来,人工智能必须要深入实体经济,深入场景帮助用户解决问题。“人工智能不能告诉别人我很美丽,但是到底怎么美丽呢?看不见。”
2014年,黄伟选定了云知声商业化两个最主要的场景:医疗、IOT。
哪知“一入侯门深似海。”
黄伟主张公司布局医疗板块收获更多的是反对意见。医疗板块持续几年在营收上规模很小,却会分散公司内部的研发资源,内部反对声音很大。外部也不看好。在云知声2018年的C轮融资时,投资人给出医疗板块业务的估值是nothing。
云知声通过AI语音+医疗,与医院合作,通过语音识别技术,能够帮助医生快速完成病历的录入,也就是电子病例,从而帮助医生提高工作效率、提升医疗质量,帮助医院节约经费。“每个医生平均每天花三个小时来写病历,现在只需要一个小时。”
产品有了,客户怎么磕?
很多人以为云知声在医疗领域的第一个客户——北京协和医院是靠关系找到的。人们不知道的是,在2016年每天早上7点钟的北京协和医院内部晨会上,都会准时看到黄伟的身影。在医生查房之前,黄伟每日会与信息处处长、分管副院长、各科室负责人讨论北京协和的信息化需求。
也是在这一年,云知声开始建立Atlas人工智能基础设施。当年,云知声拿下了协和医院与格力空调两大客户。
截至目前,云知声已拥有超过2万家行业客户与开发者,其中包括华为、美的、格力、长虹、京东、北京协和医院、福建省立医院、平安集团、吉利汽车、民生银行等多家公司和机构。
三年累亏11亿AI商业化依旧是一道坎
睿兽分析显示,云知声成立的11年间,共完成11轮融资,引入了包括挚信资本、启明创投、磐古创投、中网投、京东、奇虎360、高通创投近30家国内外一线战投机构及国家队基金,累计融资额超20亿元。
值得注意的是,2023年,云知声在递交招股书前顺利完成7.22亿元D3轮融资,投资方包括中金汇融、磐谷创投、华创深大、挚信资本等。按照云知声最后一轮融资情况,每股价格为125.69元,其当前估值达87.22亿元。
IPO前,云知声董事长兼CTO梁家恩、CEO黄伟、副总裁康恒三人通过一致行动安排,持有云知声33.93%的股份,为公司实际控制人。
挚信资本作为云知声早期投资方,当前通过TBP HK及TBP II HK分别持有8.9376%及3.5275%的股份,为云知声第一大外部股东。此外,启明创投持股9.4095%;磐古创投持股8.7091%;中网投持股6.3686%;京东持股有3.2654%。
实际上,此次冲刺港股已经是云知声第二次启动上市计划,此前在2020年11月云知声曾冲刺科创板AI语音第一股,但仅隔3个月就以“出于战略发展考虑”为由撤回上市申请。当时,正直以“AI四小龙”为首的AI企业上市潮。
在这3个多月的时间里,云知声还陷入了“数据造假”风波。其提交科创板的招股书中表示,自2012年成立以来持续深耕人工智能语音领域,在智慧生活、智慧医疗等领域已占据重要行业地位,市场份额位列第一。
同时,该招股书强调,在智慧生活子领域的白电市场,根据灼识咨询研究数据,该公司通过与格力等白电巨头合作,市场占有率高达70%;在智慧医疗领域,语音病历录入系统优势地位显著,市场占有率高达70%,病历质控系统逐渐发力,目前市场占有率约30%;公司智慧医疗类产品已在北京协和医院等近百家三甲医院上线使用。
而这份招股书披露后不久,科大讯飞便在投资者互动平台,直指云知声造假,称其“目前在家电智能语音模组领域的市场占有率已达到70%”的表述完全不符合事实。科大讯飞方面称,无论从出货量还是收入规模来说,目前云知声在家电语音应用领域的份额都不到科大讯飞的十分之一。
日前,云知声提交于港交所的招股书则显示,其在国内智慧生活与智慧医院AI解決方案的市场份额均不是首位,甚至均为个位数,与第一名相差甚远。
最新招股书显示,根据弗若斯特沙利文的数据,以2022年的收入计算,云知声于中国人工智能解决方案供应商中排名第四。值得注意的是,云知声与前三名收入差距仍较大。
招股书显示,云知声的收入主要来自销售AI产品及解决方案。2020年至2022年,云知声收入分别为2.61亿、4.56亿及6.01亿,复合年增长率为51.7%。作为对比,2022年,其它三家企业的收入分别为144.92亿元、38.06亿元和12.75亿元。
按业务划分,云知声超70%的收入来自于智慧生活。2022年,智慧生活收入4.87亿,占比81.0%;智慧医疗收入1.13亿,占比18.9%。
对于AI公司持续亏损,难以商业化的质疑,黄伟在2021年7月接受创业邦专访时曾表示,从公司的经营数据上看到了乐观的趋势,“预计2021年公司整体营收将翻倍,2年内有望实现盈利。”
不过,现实却没有想象中的那么美好。
2020年至2022年,云知声毛利率分别为34.2%、31.8%、39.9%,波动式增长。同期,云知声净利润分别为-2.98亿、-4.34亿、-3.75亿,累计亏损11.07亿;剔除股份支付开支、赎回负债利息的融资成本及开支,云知声经调整净亏损分别为2.10亿、1.72亿、1.83亿,累计亏损5.65亿。
这与其巨额研发开支密不可分,2020-2022年,云知声的研发开支分别为1.89亿元、1.88亿元及2.87亿元,分别占各年度收益的72.6%、41.3%及47.8%。云知声也坦言,由于业务仍处于扩张阶段且持续投资研发,可能继续录得净亏损。
客户数量方面,云知声由2020年的459家,增加至2021年的510家,2022年再次增加至538家。
2020年至2022年,云知声来自第一大客户的收入占比分别为20.6%、21.6%及13.1%;同期来自前五大客户的收入占比分别为40.1%、34.4%及 30.8%。相对而言,云知声的客户集中度逐步降低。
值得注意的是,其面临与客户延迟付款及违约有关的信贷风险。云知声尽管一年收入6亿,但主要以应收账款而非现金入账。2020年末至2022年末,云知声应收账款分别为1.15亿、2.66亿、3.69亿,占当期收入比例分别为44%、58%、61%,应收账款占收入比逐年提高。
此外,2020年至2022年,云知声应收账款周转天数分别为179天、185天、254天,呈现明显拉长趋势,周转率下降。
大部分收入无法以现金形式确认,也直接导致了云知声经营现金流常年为负。2020年至2022年,云知声经营现金流净额分别为-1.63亿、-2.67亿、-1.66亿。
AI大模型成为冲击港股的新故事
与云知声此前在科创板递交的招股书相比,AI大模型无疑成为了本次冲击港股的新故事。
据介绍,目前云知声的智算集群拥有超过200PFLOPS的计算能力、以及超过1.6PB的存储容量,主要提供人工智能产品和解决方案,涵盖智慧生活和智慧医疗中广泛的AI应用场景。招股书显示,2020年-2022年期间,云知声的收入主要来自提供智慧生活及智慧医疗领域相关的人工智能产品及解决方案产生收益,绝大部分收益来自国内。
今年以来,Chat类的大模型引发新一轮热潮,例如百度推出“文心一言”、阿里推出“通义大模型”、华为推出“盘古大模型3.0”、科大讯飞推出“星火大模型”等等,国内科技巨头和创业公司纷纷入局大模型,业内称之为“百模大战”。
今年5月,云知声也正式推出拥有600亿个参数的自有大语言模型“山海大模型”。黄伟在发布会上称,云知声还将持续提升山海大模型的能力,目标是在今年内达到ChatGPT的通用能力水平,并在医疗、物联、教育等多个垂直领域的能力上全面超越GPT-4。
早在2019年初,云知声就推出了首个通过无监督预训练构建、拥有数亿个参数的基于BERT的大语言模型UniCore,山海大模型是该公司利用更大规模的文本及代码数据训练开发的出具有600亿个参数的大语言模型。
招股书中,云知声用大量篇幅介绍了其山海大模型,例如:该模型可以提供强大的通用语言、知识、推理及小样本学习能力;云知声通过指令优化及从人类反馈中强化学习进一步优化山海大模型,以发展其语言生成、语义理解、知识问答、逻辑推理、数学计算和代码生成的能力,同时符合安全规则,最终目标是实现类人AGI。
绝大部分收益来自国内的云知声,还将山海大模型的目标市场瞄向了海外,其称道随着山海大模型开始提供更多语言支持,该公司将加强国际营运能力:一方面,具备多语言能力的山海大模型可以帮助解决国内客户的国际扩张需求;另一方面,通过与海外合作伙伴合作及建立海外分销渠道,期望以在中国市场已获验证的解决方案进军海外市场,赋能全球范围的智能化转型。
可以看出,云知声无疑想借助此次IPO抓住AI大模型快速增长的机会。
招股书显示,云知声此次上市募集资金的净额将用于提升研发能力,包括投资人工智能基础设施、升级云知大脑、培养人才和研发合作;投资新兴的商业机会,并提高产品在行业垂直场景中的应用和渗透;国际扩张和战略合作;营运资金和一般企业用途。
不过,需要指出的是,充足的资金将是保证AI大模型迭代的必要条件。国盛证券发布的研报显示,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM模型,训练成本介于200万美元至1200万美元之间。
对比国内科技巨头动辄数十亿、上百亿的研发投入上,云知声的研发支出就显得有点不够看了。公开数据显示,2022年百度在研发上豪掷233亿元,科大讯飞花费超30亿元,商汤科技将20.4亿元用于研发。而云知声2022年研发费尽管同期增长50%,但仍仅为2.87亿元。
而入局大模型仅仅是“烧钱”的开始。招股书显示,2020至2022年,云知声在第三方服务费上花费逐年递增,两年涨幅21.3%。招股书中也解释称,第三方服务费主要由外包非必要研发工作而产生,外包给第三方能使研发人员专注于核心AI模型及技术。
如今,尽管河南老乡黄伟历经科创板IPO撤回转而冲刺港股,但想要在群雄环伺的AI赛道站稳脚跟、扭转亏损困局,依然任重道远。
本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。