多宝电竞官网-联合光学:推动下一波AI数据中心创新浪潮

发布日期:2025-12-05 分享:

协包光学(CPO)将在提升网络性能、效率和能力方面发挥根本性作用,尤其是在AI系统的扩展结构中。

实现这些优势还需要对计算和交换资产在数据中心中的设计和部署方式进行根本性变革。Marvell正与设备制造商、电缆专家、互联公司及其他相关方合作,确保在客户准备好采用CPO时,交付CPO的基础设施能够随时准备就绪。

推动CPO的趋势

人工智能对带宽的无尽需求以及铜的物理限制推动了对CPO的需求。网络带宽每两到三年翻一番,随着带宽增加,铜线覆盖范围显著减少。与此同时,数据中心运营商正急于提升每瓦和机架的性能。

CPO通过将电转光的转换从面板上的外部插槽移至尽可能靠近ASIC的位置来缓解这一问题。这缩短了铜线走线,可能改善链路预算,从而取消数字信号处理器(DSP)或重定时器功能,从而降低整体每比特功耗,而每比特功率是AI数据中心管理中的关键指标。然而,实现商业可行性和可扩展性需要整个生态系统多年的研发,其收益很可能取决于CPO的应用场景和应用。

虽然像LightCounting这样的分析公司预测,光模块将在未来十年内继续占据数据中心内光链路的主体,CPO很可能会成为一个有意义的领域。

CPO 服务器托盘

下图展示了一个概念化的AI计算托盘,配备CPO,由SENKO Advanced Components和Marvell的产品开发。设计中可容纳四个XPU,带宽可达102.4 Tbps,通过1024根光纤传输,全部置于1U托盘中。CPO所带来的密度和覆盖范围为扩大规模化领域打开了远超铜材规模的大门。

1764058134177122.jpeg

在最近的贸易展上被问及托盘包含多少纤维时,大多数与会者猜测大约有250根纤维。实际数量是1152根纤维。

XPU的特写显示了设计的另一个方面:可维修性。每个XPU连接四台Marvell 6.4T轻型发动机,实现光电转换。这些轻型发动机与SENKO的两台36光纤可拆卸金属PIC联挂器(MPC)接口。MPC通过集成手柄识别,设计用于精确且可重复地对准微透镜及其他光学组件,这些元件将光线传输到网络中。每个计算托盘共有32个MPC,超过36,000条光纤,重复性和可靠性至关重要。

1764058226124712.jpeg1764058246961106.jpeg

Marvell 6.4Tbps 轻型发动机(顶部)将电信号转换为光学信号。两块来自Senko的36光纤金属光子集成电路(图像底部侧)安装在其顶部,将XPU连接到网络。系统的模块化使网络更加稳健、可扩展。

热与空间

Marvell、SENKO、Jabil和Mikros Technologies最近也发布了数据中心 CPO 交换机的参考设计。

以太网交换机ASIC——图像中央的大型半导体——被16片轻型发动机瓦片和1,152根光纤(128根激光光纤和1,024根数据光纤)包围。轻型发动机由16个激光模块驱动,这些模块连接到面板上以提高维护性。将激光模块置于面板上还能保持冷却,提高激光可靠性。

1764058319325454.jpeg

CPO开关参考设计包含Mikros Technologies的冷板冷却系统(铜板带蓝色盖板),有助于降低系统高度。

Mikros Technologies的冷板水冷采用低矮设计,保持系统高度为1OU(见右侧照片中央带蓝色安装支架的铜板)。主动冷却高度为3.6毫米,整体高度(包括倒钩配件和安装支架)总共为1英寸。相比之下,传统的空气冷却需要厚度为两到三倍的底盘。简单来说,转向液冷可以显著提升AI数据中心机架的密度。

这种机架密度的提升得益于Mikros Technologies的MikroMatrix™平台,这是一种冷板设计,采用垂直于表面排列的微通道矩阵阵列。这一独特设计大幅增加了冷板内的接触面积,以更好地散热。结果是卓越的传热性能、针对热点的精准冷却、更高的能效以及更大的烫的预算和整体系统可靠性的提升,远超传统有鳍和喷气冲击设计的能力。

迈向CPO生态系统

在这次CPO的经历中,我已经发现需要具备广泛的技能。电力传输、冷却、电缆管理、连接器、光学等领域的专家需要协同合作,构建高密度、尖端的系统,并开发技术,使这些独特系统的部署和维护成为一个可重复且“简单”的过程。随着规模化系统从数十个处理器增长到数百甚至数千个,这一挑战只会越来越大。

人工智能基础设施的范围和复杂性远远超出了单个公司自身的能力范围。预计将会听到更多关于Marvell如何构建生态系统以加速这一进程的信息。

多宝电竞官网-