从800G到1.6T的光模块来袭,Credo光DSP\LRO\AEC全...

科技确有核芯 2024-10-28 21:01:06

电子发烧友网报道(文/黄晶晶)Credo最新财报显示,其2025财年第一季度营收为 5970万美元,同比增长70%,GAAP毛利率为62.4%。取得如此优秀的业绩,离不开当前人工智能带动下数据中心需求的爆发。以DSP、AEC等核心产品致力于为数据中心、云、5G、超级计算等领域提供低成本、低功耗、先进的超高速连接解决方案,Credo还将拥有更大的发展潜力。

AI改变数据中心网络连接架构,光DSP有哪些需求变化?

Credo市场副总裁Chris Collins在日前接受包括电子发烧友网采访时表示,人工智能正在改变数据中心的网络连接架构,尤其是后端网络用于AI将负责连接起多个GPU。当进行AI大模型训练时,数千个GPU同时工作,就像一台大计算机。这样的架构下,后端网络的带宽将是前端网络的8-10倍。又由于不同客户所需的数据中心架构不同,这决定了将采用哪种类型的端口以及光纤收发器,从而需要不同的光学器件和DSP相匹配。

我们知道Credo 拥有多种适用于不同类型产品的光DSP产品,是市场上光DSP 种类最齐全的公司之一。Chris Collins指出,Credo在DSP的光侧使用非常特定的 SerDes IP,在DSP的电侧使用了不同的IP。这样的目的是为了让我们在光侧和电侧都获得最好的性能,并优化其功耗性能。

Seagull系列是单通道50G 的DSP产品,有两通道、四通道版本和八通道版本。Seagull 152通常被广泛应用于服务器和交换机之间的连接,Seagull 252支持分路连接,可用交换机到交换机间的连接,或交换机下行到服务器之间的连接;八通道版本的Seagull 452常应用于平面传输,例如AI网络中的交换机到交换机之间的连接,也可用于传统网络。

Dove系列基于单通道100G的DSP技术,四通道和八通道版本。并且DSP产品集成VCSEL/硅光/EML驱动版本。Dove 410D/Dove 800D是带有集成 VCSEL 驱动的产品,Dove 411/Dove 801集成 EML 驱动,Dove 412/Dove 802集成硅光驱动器的产品。

Credo 最新推出Dove 850,是针对线性接收光模块(LRO)推出的创新性产品,Chris Collins透露,不久的将来会推出全新的基于5nm的超低功耗版单通道100G的800G DSP,以及我们针对下一代单通道200G网络而设计的1.6T DSP产品。

早前,Credo已经公布将为1.6T的DSP采用3nm工艺制程,当电子发烧友网问及为何不用更成熟的工艺,毕竟这是Credo产品研发的一大优势。

Chris Collins分析,过去友商的单通道100G产品没有Credo的功耗低,当前友商是在5nm工艺上开发单通道200G产品。但是当速率来到单通道200G时,DSP功耗并不只是单通道100G DSP的两倍,实际功耗可能更高。而Credo为新的单通道200G DSP产品设定了严格的功耗目标,希望得到的每比特功耗水平比我们单通道100G还要低,因此计划采用更先进的3纳米工艺来实现这一目标,以在1.6T的高速传输下保持行业领先的能效。

Credo LRO方案,应对高速光模块的连接与功耗

数据中心光网络发展到800G时的功耗问题日益突出,于是业界此前提到过LPO的发展方向,这种模式需要移除收发器中的DSP从而降低功耗和成本,但同时带来了其他许多光纤信号质量以及需要手动调整等诸多问题,较难以部署。Credo提出LRO线性接收光模块的解决方案,仅将DSP保留在光收发器的发射端。其优势在于,当在发射端放置DSP时可以保证光纤信号的完整、高质量且符合标准。

“由于交换机Serdes 能够接收符合IEEE 标准的信号,。所以即便移除了一半的 DSP,仍旧可以保持非常好的网络性能,同时可以节省一半的 DSP 功耗,这也是LRO方案的优势所在。”Chris Collins说道。

Chris Collins表示,Credo Dove 850 是世界上第一款针对LRO 应用优化的 DSP产品。这款DSP 的功耗非常低。它能实现800G 光收发器的功耗低于10瓦。如果将其与使用完整DSP的光收发器(14 或 15 瓦)进行比较,可以节省大约 40% ~ 50%的功耗。如果将其部署在拥有数十万个光模块的数据中心,则可以节省大量功耗,且不会像LPO 解决方案一样牺牲网络性能。这款DSP现已投入生产。

在今年三月于圣地亚哥举办的OFC上,已经有三家客户采用我们的Dove 850设计了LRO的收发器。此外,有一家大型数据中心用户已经决定部署LRO,计划从明年2025年开始实施。

随着LRO概念已经得到业界的认可,越来越多厂商也在为单通道200G的产品制定计划,Credo 将开发对应的完整 DSP 以及 LRO解决方案。另外,计划在此 DSP 中集成一些独特的诊断功能,这些功能将对 AI/ML 网络大有助益。预计业界将在2025年看到Credo在这方面的研发成果。

为中国数据中心需求,定制AEC有源电缆

传统基于风冷的服务器架构,每一个机架只能放1-2台服务器,在需要很多服务器时机架之间距离较远,光纤连接链路较长。如今液冷服务器在数据中心开始流行,这样一台机架可以摆放多台AI服务器,并且服务器之间的连接距离变短,那么有源电缆(AEC)在连接中发挥的作用更加突出。

Credo在2020年推出AEC的产品,相较于传统粗线缆的DAC无源连接线缆,在传输速率来到400G及以上时DAC线缆粗且重,信号衰减快。Credo AEC是一根铜缆,里面没有任何光学组件,但每端都放置了一个基于Credo自有铜DSP技术的Retimer,来负责端到端的信号传输。

“有了芯片之后,无论是400G、800G还是1.6T,我们都还能保持一个非常细的线径,还可以在这些应用中大规模商用。这个产品已经在北美的一些互联网大厂,尤其是在他们的AI应用中得到了广泛的应用。”Chris Collins说道。

业界已经看到了AEC电缆在AI应用中独特的价值,今年Credo专门针对国内的市场需求,根据用户的数据中心速率或者场景的一些差异性,开发了专门针对国内需求的、适用于400G Q112网络接口的HiWire SHIFT AEC(有源电缆Active Electrical Cables)新系列产品,可以满足AI/ML后端网络与TOR交换机之间的网络连接需求。

Credo AEC具有低功耗,其中的电DSP都是业界功耗最低的产品,一个400G的AEC单端功率在5瓦左右,它与一个400G的光模块相比,功耗可以降低大约50%。如果在400G场景中与无源DAC相比,AEC更细更轻,更易于规整和管理,它们不容易阻挡机架的空气流影响散热。

Credo新发布的 SHIFT AEC有源电缆产品支持不同的长度规格,从0.5米到3米都有;它们都非常纤细,直径还不到5毫米,具有低功耗低误码的优异性能。适用于0-70度的商业级温度范围。

Chris Collins表示,在中国有很多大型数据中心运营客户希望找到128x400G端口的交换机和2X200G NIC卡的连接方案。Credo针对中国市场此类需求特别定制了AEC新品。此系列新品AEC电缆Breakout(分路连接)版的一端是400G,另外一端是两个200G;这两个200G的端口也有两种模式,2x100G Q112,或4×50G Q56,因此这款AEC可以支持不同类型的200G NIC和400G交换机之间的连接。另外,我们也可以提供400G直连的AEC,即两头都是400G。

总之,该新系列SHIFT AEC产品是基于Credo先进的800G HiWire AEC设计优化而来,能效卓越,性能更佳,且具有极致的可靠性, MTBF(平均故障间隔时间)大幅度延长,这一点对AI/ML应用而言至关重要。目前,该系列新品正处于样品测试阶段,预计于2025年一季度正式量产。

小结

数据中心光模块正在从400G、800G向1.6T的速率迈进,Credo的产品布局不仅满足于这一趋势,还针对客户需求提出更低功耗、更灵活的方案,使其无论在光DSP还是AEC有源电缆等的差异化中极具竞争力。

0 阅读:0