进入中国前三!联想“巨能算”

观点
2024
06/18
10:30
亚设网
分享

今年,是生成式 AI 迈向应用的元年,“数智化”转型升级下的千行百业,对于 AI 算力的渴求达到了前所未有的高度。

而“算力”的供应是否充沛,考验的是整个行业算力基础设施建设是否强大、可靠。

在此背景下,联想于 6 月 14 日举办了全栈算力基础设施新品发布会,包括服务器、存储、数据网络、边缘新品同时升级。

发布会上,联想集团副总裁、中国基础设施业务群总经理陈振宽表示:“AI 2.0 时代,联想将通过不断的科技创新和持续的产品打磨,寻求 AI 潮流中的新突破,释放 AI 基础设施的新动能。”

联想集团副总裁、中国基础设施业务群总经理陈振宽具体来说,联想正式发布了率先搭载英特尔 ® 至强 ® 6 能效核处理器的联想问天 WR5220 G5、联想 ThinkSystem SR630 V4、联想 ThinkSystem SD520 V4 服务器产品,同时还推出了全新 NetApp AFF A 全闪系列、救急 1110 灾备一体化解决方案,联想问天 100G 核心交换机等新一代存储、数据网络、边缘全栈算力的基础设施新品。

我们知道,英特尔 ® 至强 ® 处理器在服务器市场一直是各大厂商的“香饽饽”,而最新的英特尔 ® 至强 ®6 处理器在计算架构设计上采用了很多新的技术,模块设计理念、封装构造等方面都有了显著变化,而且首次拆分了性能核和能效核两个版本。因此,要做到率先全面支持英特尔 ® 至强 ®6 处理器,IT之家认为理论上应该具备两个条件:

其一是在服务器市场要有足够的出货量和市场份额;

其二是要有足够强的技术实力和生态能力,能够最快时间吃透全全新平台的技术和特性。

这两点,联想恰好都具备。

首先在市场份额方面,刚好最近 IDC 发布了一份最新的调查报告。

报告显示,联想服务器持续高速增长,跃升至中国市场第三位,销售额同比、环比增速在主流厂商中居第一。具体数字如下:中国 x86 服务器市场整体销售额同比增长 23.3%,其中联想 x86 服务器同比大幅增长 200.2%,超市场近 177 个百分点,环比逆势增长 25.6%。

而事实上在去年第四季度,联想服务器增速就已经位居中国 x86 服务器市场第一,领先市场整体增速 80 个百分点,当季位列第四。

那么在技术层面上呢?这就更有的说了。

强大的产品和技术创新力,让联想率先支持英特尔 ® 至强 ®6 处理器

首先,联想在服务器领域已经有超过 30 年的耕耘了,目前是全球三大 AI 基础设施和服务器供应商。

他们在 1995 年就推出了国内第一台 IA 架构的 PC 服务器 486/66,2023 年又推出深腾 6800 高性能计算服务器,次年,深腾 1800 大规模计算机系统荣获国家科技进步二等奖,2015 年,他们又发布了首款 ThinkAgile 融合 IT 架构的一体机……

随着 2023 年 2 月联想发布问天服务器品牌,他们构建起了联想问天 + 联想 ThinkSystem 的服务器双品牌战略,其中联想问天以“本地创新、敏捷高效”为品牌内涵,而 ThinkSystem 则立足全球,以“全球智慧 + 本地交付”为内涵。

“三高一低”,成为企业算力基建首选

双品牌的协同发力,成为联想为行业客户锻造算力服务的引擎,并且获得了市场和客户群体的充分认可。这是因为在过去多年的技术创新和沉淀下,联想服务器已经形成了高性能、高扩展、高可靠、低能耗的“三高一低”强大优势。

比如在高性能领域,联想就长期处在世界领先的地位,截至 2024 年 5 月 1 日,联想服务器共斩获 566 项性能测试世界纪录,通过 87 项 NCTC 检测认证。

同时联想服务器在高性能计算领域 12 次蝉联全球高性能计算 TOP500 榜单,9 次领跑中国 HPC TOP100 年度数量份额榜。

以最新一代联想问天 WR5220 G5 是国内首批上市的基于英特尔 ® 至强 ®6 能效核处理器的 2U2S 服务器为例。其可为客户云计算 / 大数据 / 人工智能中大型数据中心、虚拟化、在线交易、高性能计算、关键业务流和业务协同等场景提供算力。借助英特尔 ® 至强 ®6 处理器可输出 2 倍 AI 负载性能,同时在内存、PCIe 和 NVMe 带宽和数量上都有明显提升。

而实际应用方面,就拿联想助力打造的甘肃“紫金云公共算力中心”为例,该中心一期算力平台的计算系统峰值达到每秒 2730 万亿次,成为甘肃省最大的高性能计算平台。

高性能的同时伴随着高扩展。还是以联想问天 WR5220 G5 服务器为例,它就具备丰富的 I / O 扩展能力,最大可支持 20 个 3.5 寸硬盘或者 45 个 2.5 寸硬盘,以及至多 36 个 NVMe SSD,让企业可以根据需求量体裁衣,灵活配置。

可靠性方面,联想则通过双 BIOS / BMC 的“双子星”设计避免由于 BMC 故障引起的无法开机,同时“神盾”主板防过载系统可以预防 PCB 过热造成烧板,100% 预防过载烧板,并且联想在出厂前还做了百分百 1000V DC Hipot 测试,保证了联想服务器每一片板卡的超高耐压质量均超越业界的测试标准。

更值得一提的是,联想问天服务器产品获得国家电子计算机质量检测检验中心(NCTC)全面认证,为客户业务连续运行保驾护航。

除了“三高”,低功耗也是联想服务器的重要亮点。

他们一直坚持低碳制造,绿色赋能。比如在算力基础设施上,联想创新的温水水冷技术可实现 98% 的功耗部件覆盖率,推动数据中心 PUE 降低到 1.1 以内。

比如在联想助力吉利汽车打造的智能仿真平台中,联想海神温水水冷系统就将数据中心 PUE 降低至 1.1 左右,远远低于浙江省政府要求的新建数据中心 PUE≤1.4,实现新车制造绿色与安全同行。

还有数据显示,在全球 HPC Green500 榜单上,以联想服务器 ThinkSystem SR670 V2 构建的 Henri 系统,每瓦特电力消耗可执行 65.091 亿次浮点运算,成为全球最节能的高性能计算系统。

AI 2.0 时代,联想万全异构智算平台狂秀技术肌肉

在如今以大模型为基础的 AI 2.0 时代,“三高一低”只是基础,智慧化能力背后的“大模型 + 大算力 + 大数据”,已经是传统服务器架构难以应对的了,异构计算,成为新时代的要求。

从广大客户的角度来说,他们也需要一个新的计算开发和管理平台,能够集中进行算力管理与调度,满足数据治理与模型优化、训练精调和推理应用开发等多层次的能力。

于是,联想打造了万全异构智算平台。

联想万全异构智算平台是联想“一横五纵”里的“一横”,如同一个智慧的大脑,能高度自动化完成 AI 全流程开发的平台,可输出高可用算力并不断突破计算效率瓶颈的利器。

而它背后,也是联想超强技术创新和产品创新能力的集中体现。

对于 AI 引领的智能化大潮,其实联想在 2017 年就已经提前预知,并率先提出了“智能化”的概念。而面对通用算力向 AI 算力发展的趋势,联想也推出大模型训练、推理和训推一体服务器等一系列产品,分别满足不同类型的 AI 应用场景需求。

而今年 4 月,联想万全异构智算平台的发布,可以视为联想为满足 AI 应用大时代所做的技术创新的集大成者。

它拥有算力匹配魔方、GPU 内核态虚拟化、联想集合通信算法库、AI 高效断点续训技术、AI 与 HPC 异构集群超级调度器这五大创新技术,可以从不同方面帮助客户解决问题。

比如多位智能算力匹配魔方技术,通过构建 AI 场景与算法与集群硬件的匹配关系的算力魔方知识库,来标识 AI 场景、算法、集群配置三者的匹配关系,从而可针对不同场景,全自动规划和调度最佳算法和集群配置,客户只需输入场景和数据,即可自动加载最优算法和调度最佳集群配置,帮助用户跳过复杂的算力选择和验证。

而 GPU 内核态虚拟化算法技术则通过对算力和显存精准隔离的算法的升级、GPU 驱动层资源调度以及在 GPU 驱动层将虚拟 GPU 的颗粒度精细到 1% 的三大革新,将 vGPU 利用率从 80% 提升到了 95%。

此外还有联想集合通信算法库技术,突破了集群计算瓶颈,使训练效率提升 10%-15%,而 AI 高效断点续训技术,则可以实现分钟级 AI 断点续训,让 AI 集群持续可用。AI 高效断点续训技术:实现分钟级 AI 断点续训,让 AI 集群持续可用。

最后,联想万全异构智算平台独创的 AI 与 HPC 异构集群超级调度器,则通过能指挥双类型调度的最精简架构,在 AI 的 K8S 调度和 HPC 的 Slurm 调度之上,切换 AI 和 HPC 的调度沟通,能全局监控任务和动态共享资源,使得用户可以充分利用基础设施的每一分算力。

总之,联想万全异构智算平台可以说是 AI 2.0 时代联想中国基础设施战略框架的核心,也是联想超强技术和产品实力的集大成者。

两大战略 + 三大方向,为算力普惠时代护航

而未来,正如联想集团副总裁、联想中国基础设施业务群总经理陈振宽所说的:

“联想将挑战超过万卡规模集群的通信算法优化,挑战秒级的断点续训,深入研究相变式液冷技术,布局模块化液冷数据中心,助力联想 AI 算力朝着更强大、更稳定、更高效和更绿色的方向实现高质量发展。”

具体来说,联想将重点聚焦三大领域:

首先是超强算力,智能匹配:为用户匹配经过验证优化的最佳算力;

其次是核心算法,极致提效:以核心算法挖掘算力潜力,提升计算效率;

第三,液冷创新,绿色算力:即以先进的液冷技术帮助用户节能增效,并突破芯片散热的瓶颈。

整体来说,联想对于未来算力基础设施建设的战略规划,主要将围绕“AI 赋智、绿色赋能”这两大特征。AI 赋智,即 100% 算力基础设施产品支持 AI,50% 基础设施研发投入在 AI 领域,全面 AI 技术覆盖全域 AI 应用。而“绿色赋能”,主要是全面布局和引领液冷技术,打造液冷集群方案灯塔,以绿色算力基础设施助推智算产业可持续发展。

看到这,或许大家会觉得,有这样的技术实力,联想全新的服务器产品能全面率先支持英特尔第六代至强处理器已经是“小意思”了。

未来,算力将会成为和电力一样的基础公共资源,而联想的技术,就是要让人人都能用上普适和智慧的算力,这无疑是一个更加宏伟的目标,不仅体现联想在 AI 算力基础设施领域对自身强大技术创新能力的自信,更展现了他们在技术顶层规划方面的前瞻能力和超前眼光。

一横五纵,全栈算力基础设施产品既“精”又“全”

前面我们已经说到,联想要做的,是当算力成为电力一样的基础公共资源的时代,为每个人带来普适和智慧算力的、以 AI 为导向的算力基础设施建设者。

联想深知,仅在服务器层面发力是不行的,因此他们一开始规划的,就是全栈 AI 的战略布局,包括 AI 内嵌的智能终端、AI 导向的基础设施以及 AI 原生的方案服务。

而单就在基础设施方面来说,到目前为止,联想也已经形成了布局完整、稳定高效的产品组合,并构建了“一横五纵”完整格局。

前面我们也提到了“一横五纵”,这里的一横,就是联想万全异构智算平台,“五纵”,就是面向垂直领域的服务器、存储、数据网络、软件及超融合、边缘基础设施产品和方案。

正如陈振宽在发布会上所说的:“一横五纵”战略架构表达了联想对 AI 导向和本地化市场的不懈追求,同时也承载了联想助力客户智能化转型的长期承诺。“

要知道,如今联想已经将其全面的 AI-ready 基础设施产品组合扩展到 70 多款产品,并且初步形成了全栈服务器产品矩阵,连同先进存储、数据网络、超融合、高性能计算以及异构算力调度平台,为客户提供智能算力中心方案和服务核心产品。

例如在存储方面,联想是全球第三大存储设备制造商及主流存储市场(Price Bands 1-4)第一的存储提供商。

当前他们的明星产品联想 ThinkSystem DG 企业级存储阵列就拥有创新的全闪存阵列,四层式存储单元 (QLC) 架构,与 HDD 阵列相比,性能最大提升 6 倍,成本降低 50%,可提供更快的数据获取能力并加快洞察速度。

还有在边缘服务器方面,联想则通过“联想慧天”打造了业界领先的边缘计算产品家族。

比如联想慧天 ER2110 G2 就是专为边缘计算场景设计的 1U1 路短机箱服务器,具备小巧精干、灵活扩展、安全可靠等特性,能够面向安防、质检等多元场景的业务负载,为企业客户提供高性价比的边缘硬件产品。

此外还有联想问天 WX 系列超融合产品。也在引领超融合产品国产化的新征程,它涵盖服务器虚拟化软件(WxSphere)、超融合软件(WxStack)和云管理平台软件(WxCloud),形成超融合核心架构的“铁三角”,全面满足中国客户对 IT 基础设施软件定义需求。

完整覆盖的产品和技术布局,让联想在市场上能够不偏科,众多垂直行业都能均衡发展,持续赋能超过 100 家头部企业和机构。

目前像百度、阿里、腾讯、字节跳动、美团等头部互联网企业,联想实现了全面覆盖,运营商市场也分别斩获了中国联通、中国移动的数亿甚至是十几亿大单。同时联想服务器在制造业市场份额也位居前三、教育市场 HPC 则领跑第一阵营。

在三一重工,联想将分散在 100 多个不同应用位置的数据汇总到一起,近一年就产生了超过 1.2 万亿条数据,帮助集团提升效率超 30%,产能提升 50%,人力需求减少 60%,场地压缩 30%……

在青岛特钢,联想的晨星智慧眼系统能够代替原有的产线监控工人,对产线上的各类情况进行自动识别和预警,提高监控预警质量,不受疲劳情绪等人为因素影响,全天候 24 小时稳定可靠监控……

在南京大学,联想打造了南大高性能计算中心二期计算平台。六年来,系统运行稳定,故障率小于 1%,近三年的 CPU 利用率大于 93%……

不仅是自身对全栈算力基础设施的布局足够全面,联想还十分注重在 AI 算力基础设施生态的建设,比如在联想问天和联想 ThinkSystem 双品牌战略推行后,他们正不断完善对国产技术生态的支持,目前联想问天的中国团队对 XClarity 管理套件进行持续优化,还与 30 多家供应商开展密切合作,支持 337 个国产部件,以及超过 30 多个国内云 OS 版本。

此外,联想还与中国智能计算产业联盟共同发起成立了异构智算产业生态联盟,联合产业头部生态伙伴共建联想万全生态,助力中国智算生态繁荣发展与创新。

结语

发布会上,联想集团副总裁、中国基础设施业务群总经理陈振宽信心满满:面对 AI 2.0 时代发展新机遇,联想将继续依托“一横五纵”战略布局,为企业持续打造业界最全面的 AI 导向的基础设施产品组合及解决方案,助力中国企业筑牢智能化转型的数字基石,加速中国新质生产力发展。

算力是 AI 新时代的核心生产要素,也是驱动新质生产力的基础能源,而联想通过前瞻布局智能化变革,以联想问天服务器品牌发布为全新七点,全面布局 AI 导向的基础设施,已经取得了里程碑式的成果。

相信随着异构智算释放 AI 基础设施新动能,这一目标很快就会实现。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

THE END
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表亚设网的观点和立场。

2.jpg

关于我们

微信扫一扫,加关注

Top