作者: 邱智丽
2020年,面对新冠肺炎疫情巨大冲击和复杂严峻的国内外环境,人工智能的赋能效应充分发挥。伴随人工智能迈入工业化大生产阶段,夯实人工智能底层创新能力更显迫切。
日前,上海市经信委发布了“2020年度上海人工智能发展十件大事”,在这份极具风向标意义的榜单上,商汤科技启动建设的新一代人工智能计算与赋能平台重点项目名列其中。
占地面积约5.8万平方米,总投资约56亿元,仅用168天就顺利完成封顶。商汤搭建的人工智能计算平台究竟与传统互联网数据中心(IDC)有何差别?会给商汤自身业务以及整个AI软硬件产业链的国产化带来哪些支撑?针对这些问题,商汤科技联合创始人杨帆接受了第一财经专访,阐述了商汤斥巨资搭建新一代人工智能计算平台背后的底层逻辑和长远思考。
超前预判构筑
AI时代的新型数据中心
商汤智能计算中心坐落于上海临港(600848,股吧)新片区,这座宛若芯片的建筑预计于2021年底投入试运营。项目全部建成后AI计算峰值速度将达到3740 Petaflops(1 petaflop等于每秒1000万亿次浮点运算),成为国际一流的AI计算平台。
“168天完成开工到封顶,项目建设确实充满挑战,但更大的挑战源自对前沿技术和行业变革认知的提升。早于行业预判并敢于快速布局本身就不容易,还要让周围的人去理解、去相信、去接受也很难。”
杨帆告诉第一财经,伴随着国家2020年初提出新基建战略,以及近期国外相关技术进展,几乎是最近几个月才有越来越多的人关注超大规模人工智能算力。
而早在2018年4月,商汤就投资近7亿元,开始布局人工智能计算原型机的项目预研。
外界常将商汤智能计算中心简单理解为IDC,但商汤认为两者有本质区别,并将其首次定义为AI时代的新型数据中心,即人工智能计算中心(Artificial Intelligence Data Center),简称为AIDC。
杨帆表示,IDC更像是一个“数字地产”,本身带来的产业附加值极低。而AIDC则从AI赋能属性出发,帮助更多传统行业提升效率。从国务院印发的《新一代人工智能发展规划》中的战略目标来看,AI自身的行业产值和它所带动的其他行业附加值,大约是一个1:10的杠杆,这是AI最大的价值。
对于商汤而言,AIDC不仅是未来业务破局发展和高速增长的基石,也是商汤支撑芯片国产化、攻关超大模型以及打造开源算法生态的着力点与破局点。
加速芯片国产化进程
在复杂的国际局势驱动下,加速芯片国产化,成为中国半导体产业发展的一大目标。反观当下,我国AI产业发展是建立在以英伟达为主的国外企业构建的软硬件生态基础之上。
杨帆认为英伟达芯片之所以能在AI领域处于相对垄断地位,一方面源自国外在集成电路硬件相关技术上领先国内,在芯片制程及制作工艺上存在一定的代差。另一重要原因在于英伟达多年培育积累的强大配套基础计算平台(即CUDA)生态。
“一个真正好的产品,一定不是在实验室里做出来的,必须要经过市场的打磨,才能变得更好。”杨帆说道。商汤AIDC可以给专注于半导体技术本身的国产芯片厂商提供从场景需求牵引,到软件价值生态全链条的配套支持。
这如同提供了一整套高质量的考卷,上面所包含的考题足够多,难度足够大,案例足够复杂,区分度足够明显,只有答好并通过这套综合试卷的检验,国产化芯片厂商才能从众多竞争者中脱颖而出。
“国外芯片头部企业背后,都有一个强大的生态体系进行支撑。而国内的现状是专注应用场景的算法厂商较少涉足芯片领域,而芯片厂商反过来又很难接触到行业一线的反馈,没有形成一个迭代的良性闭环,但这恰恰是AI生态建立的必由之路。”杨帆表示,商汤希望通过自己的经验积累与快速迭代,为二者建立一座连接的桥梁,推动国内AI生态的建立。
据了解,2024年所有服务器到位时,商汤AIDC国产化的硬件比例将超过50%。
攻关AI超大模型训练
超大规模预训练模型是当前AI领域研究热点。2020年7月,国际知名科研机构OpenAI发布的具有1750亿参数量的GPT-3模型,构建起了其在自然语言处理领域的超大模型研究技术垄断。2021年1月,Google发布了自然语言模型Switch Transformer,参数量更是达到万亿规模。
从技术研究视角而言,超大模型是下一个促进技术突破的关键点,也是构建起算力壁垒和性能壁垒的核心。
但不容忽视的是,支撑超大模型训练所需要付出的算力成本也是惊人的。2019年,微软与人工智能研究实验室OpenAI共同规划构建的Azure人工智能算力平台为例,投资规模就达到10亿美元。此外,仅仅是完整训练一遍GPT-3这样的超大模型就需要花费1200万美元。
对此杨帆认为,“这并不意味着国内企业做数字化转型升级都需要去做这样大的一个投入。在这个过程中,需要将算力变成公共基础设施,集约化的去做产业升级。”
以上海为龙头的长三角区域,乃至整个国家的数字化转型,正是需要这样的“新基建”投入,让开发者、数据科学家和商业客户都可以低门槛应用AI。
值得关注的是,商汤已经在超大模型技术研究方面取得一定成绩。例如在计算机视觉的卷积神经网络(CNN)领域,通常模型参数都在1亿以下,商汤的AI框架SenseParrots支持50亿参数超大视觉模型的训练。
杨帆表示,商汤将在现有积累上,持续推进计算机视觉超大模型无人区技术探索输出超大规模神经网络设计研发体系,构建高精度模型壁垒,推动整个视觉领域的性能边界突破。以CNN领域为例,商汤AIDC完全投入使用后,计划支持的超大视觉模型训练参数可达更高的数量级。
开源算法生态助力“新基建”
不同于互联网时代开源软件框架,AI时代开源的核心是算法。但真正能给寻求AI产业升级的客户带来闭环价值的,是整个应用闭环的场景落地能力。因此单纯开放一个训练框架,没有生态的牵引与配合,难以给整个产业升级带来很大的价值。
商汤很早就意识到这一问题,在开源算法领域进行了多年探索,并打造了OpenMMLab计算机视觉算法开源体系,涉及了超过10个研究方向,开源了超过130种算法、1000种预训练模型。从2018年10月启动至今,OpenMMLab已经在GitHub累计收获近30000个关注,遥遥领先于其他单个垂直领域的算法和框架。
基于SenseParrots和OpenMMlab积累的平台优势,商汤AIDC向下可以接入更多的硬件厂商,把硬件算力转化为产业价值;向上可以支持更多的企业落地AI服务,支撑AI向产业赋能,形成发散式的产业链结构。
谈及将AIDC落地上海的原因,杨帆认为上海乃至长三角区域是传统重型工业和制造业最集中、发达的区域,这些产业都面临转型升级,如果能够激活它们进行数字化转型,会对整个经济产生很强的杠杆促进作用,也会给商汤带来更多的产业客户,一起创造双赢。
上海市经信委人工智能发展处副处长孙跃告诉第一财经,智能计算中心是支撑人工智能产业发展和城市数字化转型很重要的基础设施,通过超大规模、集约化的算力部署,可以降低AI技术和成本门槛,让AI真正赋能百业,起到降本、增效和提质的作用。
“通过这一平台可以将AI整个软硬件产业链打通,构建人工智能大生态,有效推动整个产业链上下游的发展,同时也能将AI能力更好地应用于经济社会发展和城市治理,这将进一步推动上海以人工智能为载体打造‘国内大循环的中心节点、国内国际双循环的战略链接’。”孙跃表示。
(李佳佳 HN153)