大装置+大模型加持,商汤驶向智能汽车深水区

专栏
2023
04/07
22:30
紫金财经
分享

(本文系紫金财经原创稿件,转载请注明来源)


犹如当初进入“电气时代”一般,身处历史变革之中的人们,难以想象这将是一场多方向的技术革新。电的广泛应用,从千家万户到产业格局日新月异,甚至多次影响历史发展的方向和脚步。


AI问世之际,颇有几分电气时代变革初期的味道,人们惊讶于技术革新的同时,也在思考其最终落地的场景。


当AI成为新一轮科技竞赛的高点时,各家AI企业开始尝试单场景的“AI+”。但商汤科技更具前瞻性的感知到AI的能力可以赋能百业,从智慧城市、智慧商业到智慧生活再到智能汽车,商汤科技将AI能力贯穿到生活的基础场景中。用AI赋能企业数字化转型,给用户带来更便捷的生活方式。


尤其是近年来,汽车智能化趋势势不可挡,智能座舱、智能驾驶已然成为汽车的标配。浪潮之下,先行者立于潮头。


早在2017年,商汤科技开始尝试AI赋能汽车,为车企提供智能汽车解决方案。探索五年后,商汤科技又进一程,于2022年第一季度成立汽车事业群。

大装置+大模型加持,商汤驶向智能汽车深水区


作为AI行业的排头兵,商汤科技在智能汽车领域的进展备受关注。目前商汤已与广汽、日产、比亚迪、蔚来等知名车企达成合作,覆盖30多家车企的80多款车型。据高工智能汽车研究院发布的《2022年度H1座舱AI软件供应商TOP10榜单》,商汤SenseAuto绝影智能汽车平台以15.76%的市场份额位居榜首。这一切都离不开商汤科技的技术底座,以技术为“压舱石”,商汤科技正在智能汽车的浪潮中乘风破浪。



六年酝酿,绝影制胜


近日商汤科技发布了2022年财报,交出了智能汽车业务阶段性的成绩单。财报显示,商汤科技2022年智能汽车业务实现收入2.93亿元,同比增长59%,汽车出货带动的前装量产收入占比增加,单车价值显著改善。


2022年,商汤绝影智能车舱和智能驾驶产品完成了27款车型的适配和量产交付,量产交付数超50万辆,新增定点数超800万辆。商汤绝影融合了“车-路-云”全方位产品矩阵,推出AI云平台——绝影车路协同平台,实现多款创新功能行业首发。


透过财报数据,虽能直观感受到商汤在汽车领域的业务增长,但或许又缺少了几分温度。


不妨换个视角从市场端来看。2022年6月,广汽集团的“未来科技先锋SUV”传祺影酷面市。基于AI感知算法,商汤绝影助力广汽ADiGO SPACE智能座舱系统,搭载了儿童关怀、疲劳缓解、分心提醒,到高速路口分心提醒、通话降音、智能通风、手势识别等10余种人机交互功能。


从儿童关怀使用场景来看,当系统感知到后排有儿童时,即自动打开后排儿童锁,防止儿童在行车途中突然开门或开窗引发意外。当锁车后,若系统感知到有儿童遗留在车内时,会及时通过短信或APP给车主手机发出告警提醒。


此外,传祺影酷搭载的“高速路口分心提醒”功能,能够捕捉司机是否有“听进”导航的提示。在车辆行驶到关键节点时,它会智能地感知驾驶员是否有做出看后视镜等准备进入匝道的动作,准确判断驾驶员的驾驶状态,并及时给予提醒,引导驾驶员平稳安全地下匝道。


在和哪吒S的合作中,商汤绝影为哪吒S带来了精准的感知、定位、规划决策控制全栈能力。商汤绝影与哪吒还将为消费者OTA更新进出匝道辅助功能,辅助引导驾驶员安全变道,避免错过匝道口等等。通过数据闭环,商汤绝影正在不断拓展场景边界。


过去几年,商汤科技利用AI能力之长,加速了车企在汽车智能化探索的脚步,但这仅是故事的开始,未来五年,将会有超过3100万辆车搭载商汤绝影智能汽车平台的各项原创产品。


智能汽车业务不断实现落地量产的背后,商汤科技已经打磨出成熟的技术方案。


大装置+大模型,挖掘智能汽车新价值


2022年,商汤科技的大装置正式向行业客户开放能力,根据财报显示,商汤科技的SenseCore AI大装置已为客户训练了超过十个大模型。


“大装置+大模型”是商汤科技一直坚守的技术路径。


分别来看,SenseCore大装置是商汤科技在AI领域前瞻性布局的基础设施。商汤官方资料显示,商汤的SenseCore由模型层、深度学习平台、计算基础设施三个部分架构而成。计算基础设施依托于商汤自主建立的人工智能计算中心(AIDC),整合了AI芯片及AI传感器,能够支撑对海量数据和算法模型的分析、训练和推理。深度学习平台则打通了训练数据平台、算法训练框架、模型压缩工具和跨平台模型部署工具,得以高效利用GPU集群算力开展模型训练;而在模型层,就涵盖了商汤开发生成的模型工厂、开源框架和开源平台,最终实现从数据存储、标注到模型训练、生产、部署、测试的全链路、批量化过程。


凭借算力基础和算法能力,SenseCore大装置大幅降低人工智能生产要素价格,进而促进高效率、低成本、规模化的AI创新和落地。


2022年,商汤的SenseCore AI大装置持续扩建,完成2.7万块GPU的部署并实现了5.0 exaFLOPS的算力输出能力。目前可最多支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。


大装置+大模型加持,商汤驶向智能汽车深水区


依托SenseCore大装置,商汤到2022年底累计商用模型数量达到 6.7 万个,比上年度提高 93%;人均研发模型数量9.35个,人效也提高了90%。


商汤的大装置为其大模型的发展提供了丰富的计算资源储备。


目前,商汤科技的不同大模型都已实现各维度的突破。在AI内容生成(AIGC)方面,商汤实现了多个文生图大模型的训练,对文字生图的理解、出图画质与推理速度等任务具备出众的能力。商汤科技还成功研发了千亿参数量的NLP预训练大模型,并将在今年年中推向市场。


而在商汤的优势领域计算机视觉(CV)方面,商汤已研发320亿参数量的全球最大的通用视觉模型,实现了高性能的目标检测、图像分割和多物体识别算法,这些技术在自动驾驶、工业质检、医疗影像等领域得到了广泛应用。


多模态大模型,给汽车加上更聪明的“大脑”


2022年末ChatGPT的走俏,让人们感知到大模型的硬实力。代入到汽车智能领域来看,不难发现,汽车复杂的行驶场景,天然适合大模型。


商汤已经将超大通用视觉模型能力引入自动驾驶技术研发,实现了BEV环视感知,做到了对超过3000类物体的高精度识别。


但当前大模型的广泛应用,虽然在部分场景中提升了自动驾驶技术,但当其应用在日常行驶场景中,其释放的价值十分局限,只能提升单一功能。面对复杂的交通路况,和其他变量的行驶者,单一大模型难以提供实时且精准的预判。


然而,自动驾驶技术应用场景的特殊性,对技术能力的容错率非常低,甚至可以说是零容错率。所以,发展多模态大模型是自动驾驶技术必然的前进方向。


在ChatGPT走红之前,2023年3月,商汤科技联合上海人工智能实验室、清华大学、香港中文大学、上海交通大学发布了多模态多任务通用大模型“书生(INTERN)2.5”,拥有30亿参数,是目前开源模型社区性能最强的多模态大模型。


书生2.5实现了通过文本来定义任务,灵活地定义不同场景的任务需求,具备通用场景下的高级感知和复杂问题处理能力。在自动驾驶场景下,可以大幅提升场景感知理解能力,准确地辅助车辆判断交通信号灯状态、道路标志牌等信息,为车辆的决策规划提供有效信息输入。


此外,多模态大模型能够同时处理不同类型的数据之间的关系。在自动驾驶中,相机提供道路和障碍物的图像信息;激光雷达传递距离和深度信息;毫米波雷达则提供速度和方向信息。多模态大模型就是将不同类型的信息数据融合,进而提供更全面、精准的自动驾驶服务。


可以通俗的理解为,书生2.5像一个更聪明的大脑,帮助汽车规划和决策所有任务流程。


放长远来看,多模态大模型助力的不仅是单个车辆的自动驾驶技术,如若未来大规模普及,规避交通行驶中其他危险变量,将彻底达到自动驾驶的终极目标,即“眼观六路、耳听八方”。让开车体验更便捷的同时,也将大幅减少交通意外。


大装置+大模型的组合,将为自动驾驶技术结构性改革提供强大的技术驱动,这也是商汤接下来的持续发力点。


除了通过“大装置+大模型”赋能智能汽车,商汤科技仍在AI领域持续探索新风向。2022年,商汤智慧生活业务收入同比增长130%,AIGC成为新增长点。


商汤科技也在财报中表示,将会夯实“大装置+大模型”的技术底座,把通用人工智能(AGI)作为核心发展战略,持续探索大算力、多模态大模型、AI专用硬件与芯片及开放研究合作,持续推进大装置和大模型能力对四大板块赋能。


总结


历史发展的经验表明,先行者并不一定能笑到最后,只有不断扩宽前进的道路,长坡厚雪、持续迭代的企业才能保持健康和活力,才能基业长青立于不败之地。


从智慧城市到智慧商业,从智慧生活到智能汽车,商汤科技正在不断扩宽AI落地的应用场景,探索更清晰、更全面的AI发展之路。以技术为利刃,商汤科技挺进AI落地的深水区, AI赋能百业的故事,正从畅想变成现实。
THE END
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表亚设网的观点和立场。

2.jpg

关于我们

微信扫一扫,加关注

Top