国盛证券发布研究报告称,英伟达(NVDA.US)正式推出H200,算力再提速。本周英伟达正式推出HGX
H200,发布时间早于此前预期的2024年,该机构认为,算力硬件竞争激烈,英伟达未来或将继续加速新品发布节奏,此举有望再加速AI进程。
国盛证券主要观点如下:
OpenAI意外改组,AGI进程不变。据OpenAI官网报道,Sam Altman 将辞去 CEO
职位并离开董事会,该公司CTO米拉·穆拉蒂 (Mira Murati) 将担任临时首席执行官。市场担心Sam
Altman的离职将影响OpenAI的研发进程,但该机构认为,AGI的全球进程已然开启,并不会因为OpenAI的人员变动而改变,同时,OpenAI作为行业领跑者也在“摸着石头过河”,人员和组织调整亦属正常,短期内或利好Anthropic、X.ai等竞争对手以及Google、亚马逊、特斯拉、Meta等玩家。
AI硬件的长期战略焦点:打破“通信墙”。微观H200
SXM的性能参数,其首次采用HBM3e工艺,141GB的显存带宽达到4.8TB/s,与H100
SXM相比,显存扩大76%的同时带宽提升了43%。早在2008年,AMD就率先意识到了通信墙问题并提出了HBM(High-Bandwidth
Memory)概念,以充分发挥游戏显卡的潜力。而当今的AI训练推理亟需超大内存来承载千亿参数量、TB级别大小的大模型,内存性能也顺理成章成为AI算力的瓶颈所在。对比来看,根据英伟达数据,内存升级带来了同比例甚至更高的性能升级,也证明了打破通信墙是提升显卡性能的有效方法。
AI硬件的强力辅助——算力调优。英伟达表示未来的软件更新预计将为H200带来额外的性能领先优势。以英伟达TensorRT开源库为例,其可以帮助开发人员优化推理过程,通过稀疏化矩阵降低一部分不必要的精度,从而降低token输出的延迟、增强token吞吐量。当下市场主要聚焦于算力的最核心环节显卡,市场普遍聚焦于企业拥有的显卡数量,纸面算力等数据,而忽略了服务器到货只是整个算力链条的第一步,软件侧的算力调优也是重要一环,通过一站式的模型末端调优服务,实现推理准确性与落地成本的平衡,这亦是打造超算互联网需要考虑的场景。
硬件加快迭代,带动光通信再提速。根据英伟达的技术路线图,原本1.6T光模块计划在2025年大规模应用,现在随着H200提前发布,整个技术路线的迭代随之加速,1.6T时代也有望更早来临。市场此前存在疑虑,光模块的需求量可能在一两年内或随着800G充分放量而步入下行阶段。AI应用快速迭代成长,算力需求并未见顶,供应侧利好频出,新兴业务蓬勃发展,投资者情绪高涨,当下应积极关注算力板块后续发展。
算力——
算力调优/调度/租赁:恒为科技、思特奇、中科金财、东方材料、博睿数据、中贝通信、恒润股份、中科曙光、中国移动、中国联通、中国电信。
光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。
算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、恒为科技、工业富联、寒武纪、震有科技。
液冷:英维克、申菱环境、高澜股份、佳力图。
边缘算力承载平台:美格智能、广和通、移远通信、初灵信息、龙宇股份、网宿科技、佳讯飞鸿。
卫星通信:三大运营商、中国卫通、中国卫星、震有科技、华力创通、电科芯片、海格通信。
数据要素——
运营商:中国电信、中国移动、中国联通。
数据可视化:浩瀚深度、恒为科技、中新赛克。
BOSS系统:亚信科技、天源迪科、东方国信。
风险提示:AI发展不及预期,算力需求不及预期,市场竞争风险。