BacktoBasic,阿里云要用CIPU定义下一代云

赵赛坡说科技 2024-03-25 01:19:53

进入 2022 年,全球云计算的市场格局尽管没有发生太大变化,但新的变革机遇正在酝酿。

一方面,3A——AWS、Azure、阿里云(Alibaba Cloud)——继续在全球主要市场保持行业领先态势;另一方面,作为云计算的重要市场,中国的云市场竞争也日趋白热化,台前幕后的客户争夺与真金白银的渠道、生态建设交替上演,形成中国式云计算的特有风景。

这也让本周举行的阿里云峰会多少显得有点「另类」,这场以「Back to Basic」为主题的峰会回到了云计算的本质——技术,无论是首次亮相的 CIPU(Cloud infrastructure Processing Units)、持续迭代的无影云电脑,还是数据中心等领域的创新,「技术纬度」里的阿里云,正在悄然定义下一代云计算的标准与规则。

这其中,CIPU 尤为关键。根据其新闻稿,CIPU 定位于云数据中心专用处理器,未来将替代 CPU 成为数据中心的计算核心。CIPU 向下接入物理的计算、存储、网络资源,在完成快速云化的同时进行硬件加速;向上则接入飞天云操作系统,管控阿里云全球上百万台服务器。

CIPU 是产业发展的必然

任何一项新技术的背后,都有其内在推动力,CIPU 的出现,也是云计算产业发展的必然。

首先,以 CPU 为中心的计算体系亟需变革。如果从本世纪初算起,云计算的发展不过二十年时间,但已经经历了两次技术迭代,早几年的分布式与虚拟化技术解决了企业弹性计算的需求,随后资源池化与云原生技术,持续优化计算与存储之间的资源调度,进一步释放了云计算弹性、可扩展的特性。

两次技术迭代本质上都是为了更好「榨取」CPU 的性能,而受限于物理定律,过去几年 CPU 的发展已经步入到瓶颈期,即便无法直接断言「摩尔定律」已失效,但整个产业界都已看到了 CPU 架构体系的局限性。

其次,人工智能、大数据等技术趋势的兴起,催生大量数据密集计算的需求,进一步放大了以 CPU 为中心的计算体系的问题。从客户需求层面看,很多计算场景都需要非常低的时延,比如自动驾驶或 AR 渲染,而大带宽,也成为众多大数据应用的基本需求,这些在 CPU 的架构里无法完全满足。

更进一步,对于阿里云来说,随着云基础设施的规模增长,如何有效管理百万级别的服务器,进而实现更高效、节能的资源调度,也需要一个全新的计算架构。

CIPU 将如何改变云的游戏规则

事实上,过去几年,包括英伟达、英特尔在内的传统芯片公司,也在通过诸如 DPU(数据处理单元)等方式解决数据中心计算架构的难题,相比于芯片公司的解决方案,作为云计算公司的阿里云,其提出的 CIPU 更有可能改变云的游戏规则。

一方面,「飞天(操作系统)+CIPU」的软硬件组合将强化阿里云在底层技术的话语权。

某种意义上说,阿里云的发展历程就是飞天操作系统「进化」的写照,过去十三年的时间,飞天操作系统成长迅速,根据其官方透露的数字,单集群可达 10 万台规模,拥有千亿级文件数、EB 级别存储空间。

CIPU 作为阿里云自研专属的云基础处理器,既能降低对上游芯片公司的依赖,又能依托于飞天操作系统以及其他一众自研产品,满足云计算的业务需求,最终带来的,是以更低的成本、更高的效率交付更好、更普惠的云计算产品。

另一方面,云计算技术竞争的本质,就是如何高效利用计算、存储和网络能力的竞争。

CIPU 瞄准的恰恰是云计算领域的产业难题。比如计算场景中服务器虚拟化后的损耗,始终是整个产业持续聚焦的技术问题,CIPU 能够快速接入不同类型资源的神龙计算平台,进一步降低不同场景中的虚拟化损耗。其中,单容器虚拟化消耗减少 50%,虚拟化容器启动速度快了 350%。而在大数据(比如 Spark)和 AI 计算场景(比如深度学习模型训练)中,CIPU 都能带来 30% 的性能提升。

再比如,通过 CIPU 支撑的全硬件虚拟化和转发加速,阿里云存储产品的时延最低可至 30us(PLX),IOPS 可达最高 300 万,存储带宽也能达到 200 Gbps,这意味着,云端存储拥有了比肩本地存储的性能,而且更安全。

至于网络能力,CIPU 的基础带宽从 100G 升级至 200G,网络时延从 22us 降低至 16us,RDMA 协议下更可低至 5.5us。这些略显冰冷的数字之上,则是云上应用与业务提升,根据阿里云提供的数字,(客户)应用上云之后,比自建物理机的集群吞吐量提升了 30%,业务高峰期延迟下降了 90%。

写在最后:技术长征没有终点

正如阿里云智能总裁张建锋所言,「我们看到云计算进入了一个新的发展阶段,我们越来越接近于下一个时代」。在历经近二十年的快速增长之后,云计算的技术、产业以及生态已经成为推动全球数字化的重要基础设施,而新的客户需求与技术趋势,促使云计算公司不断思考下一代云的态势。

阿里云也不例外,而如果将 CIPU 放在阿里云自研技术的「兵器谱」上,CIPU 的出现也是理所当然。除飞天操作系统之外,阿里云过去几年在底层芯片、服务器操作系统、计算、存储、数据库等领域拥有大量自研产品,这些产品构建起了一条技术护城河,也为阿里云未来的持续增长奠定技术基础。

更进一步,在越发复杂与不确定性的国际竞争环境里,作为数字基础设施的云计算产业,也需要发力自主可控与自研的技术与产品,「我们错过了 PC 时代,但云这个时代大家起步是一样的。现在是重新定义云的窗口期,如果我们定义好了,中国就可以在下一个技术时代有自己的一席之地」,张建锋如是说道。

也因此,CIPU 既是阿里云新技术长征的起点,也是中国云计算公司定义全球行业标准的起点。(完)

0 阅读:0