厘清算力挑战,首部“东数西算”设施白皮书发布!

自主可控新鲜事 2022-09-22 10:46:09

首部东数西算基础设施白皮书正式发布!

出品丨自主可控新鲜事

转载请注明出处

正文共1417,建议阅读时间3分钟

伴随国内数据爆发式增长,存储、计算等需求大幅增加,构建新型算力基础设施和网络体系变得更为迫切。

在此背景下,9月19日,首部东数西算基础设施白皮书:《“东数西算”下新型算力基础设施发展白皮书》(以下简称《白皮书》)正式发布。

《白皮书》发布会上,中国科学院院士陈润生、中国工程院院士郑纬民、北京应用物理与计算数学研究所研究员袁国兴,国家信息中心信息化和产业发展部主任单志广、中国科学院计算技术研究所研究员张云泉、中国智能计算产业联盟秘书长安静等针对算力新基建面临什么样的新挑战等问题进行了探讨。

繁荣与挑战并存

工信部《新型数据中心 发展三年行动计划 (2021-2023 年 ) 》中提出,到 2023 年底,全国数据中心总算力超过 200EFLOPS。对此,《白皮书》指出,我国算力基础设施迎来了大规模需求的繁荣期,但同时也面临着诸多挑战。

目前,算力似乎还未充分地转化为生产力,如伴随行业应用的多样性日益丰富,现有通用算力难以满足多样化场景需求。如很多智算中心提供的算力只能用于低精度的AI模型训练,这都将成为未来算力集约化管理的阻碍。此外,数据中心绿色发展势在必行,如何通过新兴技术实现节能减排,成为行业的关注重点和亟须解决的难题。

对于众多新需求与挑战,《白皮书》提出的解决思路之一是“用技术解难题”。

白皮书发布现场,从左:安静、单志广、陈润生、郑纬民、袁国兴、张云泉

液冷技术破解“东数东算”难题

数据中心高能耗是其显著特征,东数西算模式目标之一,就是透过全国算力网络降低数据中心整体能耗。但现实是,承载游戏、电商、短视频等场景的“热”数据中心,无法迁移到西部,以利用自然资源降低能耗。

单志广表示,“东数西算”只是“全国一体化大数据中心协同创新体系”的一个下辖概念,而后者旨在推进技术、业务、数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务,其实现方式不是固定不变的。因此,面对不同应用场景,还可能有东数东算、南数北算等模式,应因地制宜。

但国家政策又要求东部地区节点数据中心PUE(能源利用率)值不超过1.25。在此背景下,按需新建东部数据中心,能否搭载降低PUE的节能与绿色技术很关键。单志广也介绍,液体冷却、清洁能源、余热回收等绿色低碳技术应加大推广利用,液冷未来重大的发展趋势。

所幸很多厂商都已加大在液冷领域的投入,如《白皮书》中列举的曙光相变液冷技术方案,就可让数据中心PUE最低降至 1.04,实现全地域全年自然冷却,极大的节约电与水的使用。

“一体化平台”统筹各地算力中心

当前各行业应用对算力的多元化需求日益显著,这就需求“东数西算”可为用户提供更加通用化、多元化的算力选择,建设“东数西算”算力设施时,也应考虑兼容性,以促进技术、数据、业务的最大化利用和流通,促进算力普惠服务。

张云泉表示,算力若像电力一样方便取用,关键需要统一标准和实现智能化调度,构建起“算力插座”,这需要底层硬件的通用性和软件栈的打通,包括中科曙光在内的企业,也在积极参与其中,解决算力接入、调度、智能化匹配等难题。

《白皮书》介绍,中科曙光专门成立了“曙光智算”子品牌,以统筹各地算力中心的一体化运营和对外服务。目前,曙光不仅拥有自持的海量原生算力资源,还已实现与十余个区域算力中心的接入,并实现了极速互联与融合调度,已初步建成集算力、存储、数据和增值服务为一体的“全国一体化算力服务平台”,目前该平台已服务超10万用户,作业提交量突破3000万。

0 阅读:12