智东西

作者 | 周炎


(相关资料图)

编辑 | 漠影

智东西6月30日报道,近日,国内领先的服务器企业宁畅信息产业公司(简称:宁畅)宣布推出“无忧焕液计划”,通过多梯度数据中心液冷套餐,助客户解决数据中心升级问题。

今年以来,随着“百模大战”的打响,数据中心对散热能力提出了更高的要求,传统风冷散热受到挑战。但目前各种类型的数据中心在“风冷”转“液冷”的过程中还面临着技术难、建设久、成本高等难点。

宁畅CEO秦晓宁说:“当前AI服务器需求暴涨,但80%-90%的数据中心依然采用风冷散热,尽管数据中心节能政策频出,液冷投入成本下降,但液冷升级中仍存在着多重困难,不同行业问题也各不相同。”

为此,宁畅面向无法规模部署且对价格有所顾虑的用户、对液冷有强烈需求的用户、对节能需求高且预算充足的用户三大目标用户群,提供差异化迭代服务,推动液冷从“奢侈”走向“普惠”。

一、AI算力需求爆发,数据中心液冷升级面临“三道坎”

随着人工智能领域大模型“百模大战”的打响,大模型玩家对AI服务器的需求急剧增加,与此同时,AI服务器中的CPU/GPU芯片的功耗也随着算力能力的提高而提升。

从招商证券发布的报告来看,AI拉动算力密度将从8kW/柜提升到50kW/柜,然而自然风冷数据中心单机密度一般只支持8-10kW。显然,这已经突破传统风冷散热能力的范畴。

液冷相较于风冷有四大显著优势

与此同时,近两年来,数据中心节能政策频出,今年4月,北京市颁布了《关于进一步加强数据中心项目节能审查的若干规定》,规定指出数据中心的PUE(能源使用率)值要小于,而且还需要按照PUE值采取阶梯电价。

PUE值是数据中心的实际能耗与计算能耗的比值,PUE值通常比1大,这个值越接近1,代表绿色程度越高、能源浪费越少。这样也就不难理解为什么规定中要将数据中心的PUE值限制在以下了。

此前,数据中心由“风冷”转“液冷”还有一大顾忌就是“液冷投入成本”,近年来,液冷投入成本正在不断下降。以功率度为10kW/机架为例,风冷和液冷的数据中心投资成本大致相当,但是液冷数据中心提升4倍功率密度后,可节省14%的投资成本。

虽然,大模型使厂商对液冷的接受度有所增加,但目前80%-90%的数据中心依然采用风冷散热,液冷升级中仍存在着多重困难,不同行业问题也各不相同。

宁畅CEO秦晓宁讲解目前“老旧难”数据中心面临的三道难关

秦晓宁称,宁畅在调研后发现,过去87%的“老旧难”数据中心的液冷升级存在三道难关。

1.“技术难”,液冷属于技术密集型产业,液冷冷头的热性能提升、多冷头均流性、复杂部件液冷适配等技术的积累非常重要,这就意味这不掌握相关技术的厂商很难布局;

2.“成本高”,液冷数据中心初期建设成本要比风冷高出10%左右,成本问题也限制了一些厂商采取下一步的行动;

3.“建设久”,一些原本的风冷数据中心想要改造成液冷数据中心可能会涉及到楼体改造、空间重布等环节,因此导致落地困难。

这也导致了即使一些数据中心有“风冷”转“液冷”的需求,但是由于上面三道难关也只能继续使用“风冷”散热方案。宁畅在过去几年也遇到过这样的合作伙伴,在长期的摸索下,宁畅为这些“老旧难”数据中心的“液冷升级”提供解决方案。

二、面向三类客户,宁畅“无忧液冷计划”提供三档套餐

考虑到数据中心的规模不同,承担业务的负载也不同,想要为电力系统、能源条件、能效目标等指标不同的企业提供服务,就更需要定制化和具有针对性。

宁畅CTO赵雷称,过去几年,宁畅经历改造过太多的数据中心,机房建筑的特点、所在层级的不同、户外是否有自然冷源都深深地影响着数据中心的“风冷”改“液冷”方案。基于此, 宁畅推出了“无忧液冷计划”,即面向三大目标客户设计出三档套餐,以解决实际升级问题。

首先,针对无法规模部署且有价格顾虑的用户,宁畅团队可在24小时内为客户实现风冷服务器节点内的液冷改造以及液冷机柜升级。据称,该方案可免机房部署,对比同型号配置全新机器,成本降低90%,性能提升10%。

其次,面向对液冷有强烈需求的用户,如互联网、金融、科研、运营商等,宁畅提供升级版,即全栈液冷模块化解决方案。在该方案下,宁畅不仅会将服务器本身进行升级,此外,还将数据中心机房基础设施环境侧等一起改造。

第三,对热流密度高、节能需求高的用户,宁畅将提供浸没液冷全系统方案,宁畅将基于浸没液冷服务器及其相关配套设施进行升级,实现20%性能提升,30%节能效果优化。

在活动现场,秦晓宁以规模为240台服务器的单机房为例,分别计算出风冷方案和液冷方案每年的电费情况。从数据上看,风冷方案下,厂商需要支付万元人民币,而液冷方案,厂商仅需要支付73万元人民币,而将时间范围扩展到5年,使用液冷方案的全周期成本费更为可观,较风冷方案节省了万元。而大型数据中心远不止240台服务器,以2万台的服务器的数据中心为例,5年可节省1亿元人民币能耗成本。

结语:AI浪潮推动数据中心技术新升级

可以看到,在“百模大战”的背景下,传统风冷方案已经跟不上AI服务器散热需求。同时无论是从政策角度、还是市场需求、抑或是技术发展等层面,液冷正成为大模型时代数据中心散热的重要方式。

同时,企业在做大模型的过程中也需要考虑效率成本,对他们来说,减少服务器成本、IDC升级工程化成本等算力成本是一个系统工程。宁畅发布的“无忧焕液”计划,有助于帮助这些企业的数据中心降低液冷升级门槛,实现绿色与算效同步升级。